17611538698
webmaster@21cto.com

IBM 发布下一代 Granite LLM

资讯 0 289 2024-10-24 07:10:00

图片

导读:IBM 宣布推出其开源Granite LLM 系列的第三代产品,该系列具有多种适用于各种场景用例的不同模型。 

图片

IBM 在一篇博客中这样写道:“新款 IBM Granite 3.0 型号体现了我们对强大与实用之间平衡的关注,相对于模型大小,它提供了最先进的性能,同时最大限度地提高了企业用例的安全性、速度和成本效益。”

Granite 3.0 系列包括通用模型、更注重护栏和安全模型以及混合专家模型。 

该系列的主要模型是 Granite 3.0 8B Instruct,这是一种经过指令调整的密集解码器专用模型,在 RAG、分类、摘要、实体提取和工具使用方面具有强大的性能。据 IBM 称,它在学术基准上与类似规模的开放模型相匹配,并在企业任务和安全性方面超越它们。

IBM 提道:“开发人员友好的 Granite 3.0 8B Instruct 采用新颖的两阶段方法,对 12 种不同自然语言和 116 种不同编程语言中,超过 12 万亿个经过仔细审查的数据进行训练,是一种主力企业模型,旨在作为复杂工作流程和基于工具用例的主要构建块。”

此版本还包括新的 Granite Guardian 模型,可防止社会偏见、仇恨、毒性、亵渎、暴力和越狱行为,以及执行 RAG 特定的检查,如基础性、上下文相关性和答案相关性。  

Granite 3.0 系列还有许多其他型号,包括: 

1 Granite-3.0-8B-Base、Granite-3.0-2B-Instruct 和 Granite-3.0-2B-Base,通用 LLM

2 Granite-3.0-3B-A800M-Instruct 和 Granite-3.0-1B-A400M-Instruct,是混合专家模型,可最大程度降低延迟和成本

3 Granite- 3.0-8B-Instruct-Accelerator,是一种推测解码器,可提供更快的速度和更高的效率

所有模型均可在 Hugging Face 上根据 Apache 2.0 许可使用,而 Granite 3.0 8B 和 2B 以及 Granite Guardian 3.0 8B 和 2B 可在 watsonx 上用于商业用途。 

该公司还透露,到 2024 年底,计划将所有模型上下文窗口扩展到 128K 个令牌,进一步改善多语言支持,并引入多模式图像输入、文本输出功能。 

除了发布这些新的 Granite 模型之外,该公司还透露即将推出最新版本的 watsonx Code Assistant,并计划通过 watsonx.ai 发布供开发人员构建、定制和部署 AI 的新工具。

IBM 声称Granite 3.0 在多项任务上的表现比Google、Anthropic 等竞争对手的最新模型优胜,其中特别在安全性和可信度,以及不同规模模型在推理成本方面都有优势。IBM 还决定以Apache 2.0 开源许可证发布这些模型,为企业合作伙伴提供更大的灵活性。

编辑:场长

评论