谷歌发布推理模型 Gemini 2.5，这是其迄今为止“最智能的 AI 模型”

17611538698

webmaster@21cto.com

登录注册

谷歌发布推理模型 Gemini 2.5，这是其迄今为止“最智能的 AI 模型”

场长

资讯 2 416 2025-03-27 12:02:25

谷歌宣布发布Gemini 2.5，这是一种新的推理模型，该公司声称这是其迄今为止“最智能的AI模型”。

“Gemini 2.5 模型是思维模型，能够在做出反应之前通过思维进行推理，从而提高性能和准确性。在人工智能领域，系统的“推理”能力不仅仅指分类和预测。它指的是分析信息、得出合乎逻辑的结论、结合背景和细微差别并做出明智决策的能力，”谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在一篇博文中如此写道。

Gemini 2.0 Flash Thinking是谷歌首个推理模型，而 Gemini 2.5 则在此基础上改进了基础模型，并改进了后期训练。谷歌在公告中透露，未来所有 AI 模型都将内置推理能力。

第一个 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental，它在 LMArena 基准测试中远远领先于 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

它还在 Humanity's Last Exam 上获得了 18.8% 的分数，这是“由数百名学科专家设计的数据集，旨在捕捉人类知识和推理的前沿”。它还擅长编码，特别是创建 Web 应用程序和代理应用程序，以及处理代码转换。相比之下，OpenAI o3-mini 得分为 14%，DeepSeek R1 得分为 8.6%。

该模型现已在 Google AI Studio 和 Gemini 应用程序中供高级订阅者使用。谷歌正在努力将其添加到 Vertex AI 中，并将在未来几周内公布该模型的定价。

在推出时，它提供了 100 万个令牌上下文窗口，并且该公司正在努力尽快添加 200 万个令牌上下文窗口。

相关链接：

https://deepmind.google/technologies/gemini/flash-thinking/

本文为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

评论

场长

标准用户

最新文章

使用 PHP WebSocket：构建实时应用程序

使用 PHP WebSocket：构建实时应...

04月24日

OpenAI 有意愿收购 Chrome ，以增强其 AI 体验

OpenAI 有意愿收购 Chrome ，以...

04月24日

近4年不租房睡车里省10万！深圳41岁程序员回应了

近4年不租房睡车里省10万！深圳4...

04月24日

开源关系数据库管理系统 MySQL 9.3 发布

开源关系数据库管理系统 MySQL 9...

04月24日

Snyk 宣布推出用于保护 API 和 Web 应用程序的全新 DAST 解决方案

Snyk 宣布推出用于保护 API 和 W...

04月24日

塑造我成为 CTO 之路的秘诀

塑造我成为 CTO 之路的秘诀

04月23日

CTO 洞察：数字化优先商业未来的 4 个关键经验

CTO 洞察：数字化优先商业未来的...

04月22日

Agentic IDE：智能编码的下一个前沿

Agentic IDE：智能编码的下一个...

04月21日

Docker 推出 MCP Catalog 和 Toolkit

Docker 推出 MCP Catalog 和 Too...

04月23日

了解 PHP 中的继承

了解 PHP 中的继承

04月21日

微软 CTO 凯文·斯科特：未来AI将涌现大量专业Agent

微软 CTO 凯文·斯科特：未来AI将...

04月21日

奥特曼：对 GPT 说谢谢会带来数千万美元开销

奥特曼：对 GPT 说谢谢会带来数...

04月23日

对开发者的警告：远离这 10 个 VSCode 扩展

对开发者的警告：远离这 10 个 V...

04月21日

数据库正确的选型艺术

数据库正确的选型艺术

04月21日

AI 头条：新的 OpenAI 模型、NVIDIA AI-Q 蓝图以及 Anthropic 的 Google Workspace 集成

AI 头条：新的 OpenAI 模型、NVI...

04月21日

NativePHP桌面版V1.0正式发布

NativePHP桌面版V1.0正式发布

04月14日