Naver 推出多语言大模型：HyperCLOVA X LLM，“为亚洲构建主权人工智能”

17611538698

webmaster@21cto.com

登录注册

Naver 推出多语言大模型：HyperCLOVA X LLM，“为亚洲构建主权人工智能”

场长

人工智能 0 109 2024-04-09 10:54:37

韩国互联网巨头 Naver 上周发布了一系列名为 “HyperCLOVA X” 的大语言模型。

该公司声称该模型在亚洲语言的跨语言推理方面比其他模型表现更好，因此可能有助于该地区开发主权型大语言模型。

Naver宣布HyperCLOVA X 在韩语中首次亮相，开放期刊 arXiv 上的一份英文技术报告评测了该模型，该报告声称“我们相信 HyperCLOVA X 凭借其在英语和韩语以外其他语言方面的竞争能力，并可以为各地区提供有用的指导或国家发展自己的主权大语言模型。”

据称，HyperCLOVA X 接受了“由韩语、多语言和代码段组成”的数据预训练。

多语言子集主要是英语，但也包括各种其他主流语言，例如日语、德语和法语。

韩语材料约占预训练数据的三分之一，这表明 Naver 选择提高其母语模型的性能，预训练过程还考虑了韩语的特殊语法。

Naver 声称，这一努力的结果便是“天生精通韩语和英语”的模特。

更好的表现是，这些模型显示出“多语言能力“，使用除训练处理语言之外的语言进行工作的能力。

“我们的分析表明，HyperCLOVA X 不仅能够将其推理能力扩展到其主要目标语言之外，而且在韩语和非目标语言（例如日语与中文）之间的机器翻译方面也达到了最先进的水平，”。

技术报告还指出：

“HyperCLOVA X 令人印象深刻的多语言能力，还包括韩语和英语之间的跨语言转换，其中一种语言的指令调整可以导致另一种语言的指令跟踪功能的出现。”

多语言测试结果，可以让开发者得出更好的结论，HyperCLOVA X“可以转移到预训练数据中代表性不足的亚洲语言”。

作者：万能的大雄

本文为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

评论

场长

标准用户

最新文章

人工智能革命商业：大语言模型的 5 种变革性用途

人工智能革命商业：大语言模型的...

04月29日

在 Mac（M1、M2 或 M3）上运行最新大语言模型 Llama 3 的分步指南

在 Mac（M1、M2 或 M3）上运行最...

04月29日

微软开源 MS-DOS 4.0 ，使用 MIT 许可证

微软开源 MS-DOS 4.0 ，使用 MIT...

04月29日

乌克兰程序员发明新编程语言，同时亦是一种大数据结构

乌克兰程序员发明新编程语言，同...

04月29日

开发者如何与干扰作斗争

开发者如何与干扰作斗争

04月20日

开源推荐：AI 面试模拟器

开源推荐：AI 面试模拟器

04月24日

Uber 是如何构建实时基础设施每天处理 PB 级数据的

Uber 是如何构建实时基础设施每...

04月22日

怎样在 Python 中生成随机数

怎样在 Python 中生成随机数

04月25日

会话身份验证 vs 令牌身份验证：孰优孰劣？

会话身份验证 vs 令牌身份验证：...

04月24日

管理者们：如何让开发者发挥最大创造力？

管理者们：如何让开发者发挥最大...

04月24日

开源版 Linux 性能监控守护进程与自动化工具 Guider 发布

开源版 Linux 性能监控守护进程...

04月22日

白宫：微软是国家安全威胁；黄仁勋：人形机器人是未来主流；奥尔特曼投资Exowatt为 AI 提供电力；Kubernetes 新发布

白宫：微软是国家安全威胁；黄仁...

04月24日

IBM 官宣收购 HashiCorp ，实现多云 IT 自动化

IBM 官宣收购 HashiCorp ，实现...

04月26日

微软推出Phi-3，3.8亿参数能与GPT-3.5T相媲美，量化后可直接在iPhone运行

微软推出Phi-3，3.8亿参数能与GP...

04月25日

Linus Torvalds ：要有趣，要有爱，还要对别人有用

Linus Torvalds ：要有趣，要有...

04月22日

技术招聘：大多数雇主在 2023 年增加了工作岗位或维持现状

技术招聘：大多数雇主在 2023 年...

04月25日