17611538698
webmaster@21cto.com

Google发布 Gemma 两个新变种:CodeGemma 与 RecurrentGemma

人工智能 0 823 2024-04-10 04:46:49



Google 宣布正在扩展 Gemma 人工智能模型系列,推出两个新型变体,一种用来代码生成,另一种用来推理。 

对于代码生成,它发布了 CodeGemma,提供智能代码完成与生成。Google 声称,它能够一次生成整个代码块。 

据Google研发团队称,CodeGemma 接受了来自在线文档、数学和代码高达 5000 亿个令牌的训练,并且可以与多种流行的编程语言一起使用。 

它本身有多种不同的变体,包括专门用于代码生成和完成的 7B 预训练版本、擅长代码聊天和指令跟踪的 7B 指令调整版本以及用于在本地设备上快速完成代码的 2B 预训练变体。 

而 RecurrentGemma 其目标为改进更高批量尺寸的推理,这对研发人员特别有用。

它提供较低的内存要求,使其可用于生成内存有限的设备样本。由于内存使用量较低,它还可以以每秒更多的令牌处理更高的数据批量尺寸。 

目前,这两个模型现在可以在 Kaggle、Hugging Face 和 Vertex AI Model Garden 上试用。


参考:
https://developers.googleblog.com/2024/04/gemma-family-expands.html
作者:万能的大雄

评论