Naver 推出多语言大模型：HyperCLOVA X LLM，“为亚洲构建主权人工智能”

17611538698

webmaster@21cto.com

登录注册

Naver 推出多语言大模型：HyperCLOVA X LLM，“为亚洲构建主权人工智能”

场长

人工智能 0 1487 2024-04-09 10:54:37

韩国互联网巨头 Naver 上周发布了一系列名为 “HyperCLOVA X” 的大语言模型。

该公司声称该模型在亚洲语言的跨语言推理方面比其他模型表现更好，因此可能有助于该地区开发主权型大语言模型。

Naver宣布HyperCLOVA X 在韩语中首次亮相，开放期刊 arXiv 上的一份英文技术报告评测了该模型，该报告声称“我们相信 HyperCLOVA X 凭借其在英语和韩语以外其他语言方面的竞争能力，并可以为各地区提供有用的指导或国家发展自己的主权大语言模型。”

据称，HyperCLOVA X 接受了“由韩语、多语言和代码段组成”的数据预训练。

多语言子集主要是英语，但也包括各种其他主流语言，例如日语、德语和法语。

韩语材料约占预训练数据的三分之一，这表明 Naver 选择提高其母语模型的性能，预训练过程还考虑了韩语的特殊语法。

Naver 声称，这一努力的结果便是“天生精通韩语和英语”的模特。

更好的表现是，这些模型显示出“多语言能力“，使用除训练处理语言之外的语言进行工作的能力。

“我们的分析表明，HyperCLOVA X 不仅能够将其推理能力扩展到其主要目标语言之外，而且在韩语和非目标语言（例如日语与中文）之间的机器翻译方面也达到了最先进的水平，”。

技术报告还指出：

“HyperCLOVA X 令人印象深刻的多语言能力，还包括韩语和英语之间的跨语言转换，其中一种语言的指令调整可以导致另一种语言的指令跟踪功能的出现。”

多语言测试结果，可以让开发者得出更好的结论，HyperCLOVA X“可以转移到预训练数据中代表性不足的亚洲语言”。

作者：万能的大雄

本文为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

评论

场长

标准用户

最新文章

NativePHP桌面版V1.0正式发布

NativePHP桌面版V1.0正式发布

04月14日

OpenAI 推出其 GPT-4.1 旗舰 AI 模型

OpenAI 推出其 GPT-4.1 旗舰 AI...

04月18日

“人类测试员”在利用AI能进行软件测试中的作用

“人类测试员”在利用AI能进行软件...

04月15日

AI 头条：谷歌用于构建 AI 代理的新工具、GitHub Copilot 中的代理模式等

AI 头条：谷歌用于构建 AI 代理...

04月14日

AI 正在重新定义软件开发

AI 正在重新定义软件开发

04月17日

FreeDOS 1.4来了：仍然是 DOS，比以往更加现代

FreeDOS 1.4来了：仍然是 DOS，...

04月11日

我认识的最好的程序员

我认识的最好的程序员

04月14日

谷歌发布推理模型 Gemini 2.5，这是其迄今为止“最智能的 AI 模型”

谷歌发布推理模型 Gemini 2.5，...

03月27日

开源电子书管理软件“Calibre 8.2.1”发布

开源电子书管理软件“Calibre 8.2...

04月08日

Oracle 云透露其被攻击

Oracle 云透露其被攻击

04月11日

Cloudflare 开源 OPKSSH，具备单点登录SSO等功能

Cloudflare 开源 OPKSSH，具备单...

04月07日

Python 发布新的标准包锁文件格式

Python 发布新的标准包锁文件格...

04月07日

了解当前 AI 开发者工具生态系统

了解当前 AI 开发者工具生态系统

04月09日

JetBrains 宣布推出 AI 工具免费套餐

JetBrains 宣布推出 AI 工具免费...

04月17日

OpenAI 反诉马斯克，谴责其“虚假”收购

OpenAI 反诉马斯克，谴责其“虚假...

04月11日

如何成为顶尖 1% 程序员：你必须走的路

如何成为顶尖 1% 程序员：你必须...

04月09日