Google 宣布正在扩展 Gemma 人工智能模型系列,推出两个新型变体,一种用来代码生成,另一种用来推理。
对于代码生成,它发布了 CodeGemma,提供智能代码完成与生成。Google 声称,它能够一次生成整个代码块。
据Google研发团队称,CodeGemma 接受了来自在线文档、数学和代码高达 5000 亿个令牌的训练,并且可以与多种流行的编程语言一起使用。
它本身有多种不同的变体,包括专门用于代码生成和完成的 7B 预训练版本、擅长代码聊天和指令跟踪的 7B 指令调整版本以及用于在本地设备上快速完成代码的 2B 预训练变体。
而 RecurrentGemma 其目标为改进更高批量尺寸的推理,这对研发人员特别有用。
它提供较低的内存要求,使其可用于生成内存有限的设备样本。由于内存使用量较低,它还可以以每秒更多的令牌处理更高的数据批量尺寸。
目前,这两个模型现在可以在 Kaggle、Hugging Face 和 Vertex AI Model Garden 上试用。
参考:
https://developers.googleblog.com/2024/04/gemma-family-expands.html
作者:万能的大雄
本文为 @ 万能的大雄 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。