17611538698
webmaster@21cto.com

2025 年 3 月 28 日:一周 AI 资讯更新,Gemini 2.5、OpenAI 4o 图像生成、微软新推理代理

资讯 1 173 2天前


软件公司不断尝试在其平台上添加越来越多的 AI 功能,而 AI 公司也在不断发布新模型和功能。要跟上这一切可能很困难,因此我们撰写了这篇综述,分享开发者应该了解的几项有关 AI 的重要更新。

谷歌发布推理模型 Gemini 2.5,这是其迄今为止“最智能的 AI 模型”

Gemini 2.0 Flash Thinking 是谷歌首个推理模型,而Gemini 2.5则在此基础上改进了基础模型,并改进了后期训练。谷歌在公告中透露,未来所有 AI 模型都将内置推理能力。

第一个 Gemini 2.5 模型是 Gemini 2.5 Pro Experimental,它在 LMArena 基准测试中领先于 OpenAI o3-mini、Claude 3.5 Sonnet 和 DeepSeek R1 等其他推理模型。

“Gemini 2.5 模型是思维模型,能够在做出反应之前通过思维进行推理,从而提高性能和准确性。在人工智能领域,系统的“推理”能力不仅仅指分类和预测。它指的是分析信息、得出合乎逻辑的结论、结合背景和细微差别并做出明智决策的能力,”谷歌 DeepMind 首席技术官 Koray Kavukcuoglu 在一篇博文中如此写道。 

OpenAI 宣布 4o 图像生成

最新的图像生成模型改进了文本渲染,能够通过多个后续提示来细化图像,并提供更好的指令跟踪,能够在提示中处理多达 10-20 个不同的对象。 

它还可以进行上下文学习,以分析和学习用户上传的图像,并且该模型还将其知识链接到文本和图像之间以产生更好的结果。 

GPT 4o 图像生成已开始作为默认图像生成器向 Plus、Pro、Team 和 Free 用户推出,并且 Enterprise 和 Edu 类型用户很快也将可以使用。 

微软在 Microsoft 365 Copilot 中推出新的推理代理

研究员和分析师这两个代理可以帮助用户分析大量信息,包括电子邮件、会议、文件、聊天等。 

Researcher 非常适合多步骤研究,例如根据公司的工作背景和在线找到的更广泛的竞争数据制定上市策略。除了 Microsoft 365 中的数据外,它还可以利用第三方连接器从 Salesforce、ServiceNow 和 Confluence 等来源引入数据。

Analyst 专为复杂数据分析而设计,例如将来自多个电子表格的原始数据转换为新产品的需求预测或客户购买模式的可视化。 

作为 Frontier 早期访问计划的一部分,这两款代理将从 4 月开始向 Microsoft 365 Copilot 订阅者推出。 

Microsoft Security Copilot 获得了几个新代理

新代理包括 Microsoft Defender 中的网络钓鱼分类代理、Microsoft Purview 中的警报分类代理、Microsoft Entra 中的条件访问优化代理、Microsoft Intune 中的漏洞修复代理以及 Security Copilot 中的威胁情报简报代理。

该公司还宣布了来自其微软安全合作伙伴的另外五个代理:OneTrust 的隐私泄露响应代理、Aviatrix 的网络主管代理、BlueVoyant 的 SecOps 工具代理、Tanium 的警报分类代理和 Fletch 的任务优化代理。

这些代理将于四月开始向开发者提供预览。

“基于 Security Copilot 的变革能力,六个 Microsoft Security Copilot 代理使团队能够自主处理大量的安全和 IT 任务,同时与 Microsoft Security 解决方案无缝集成。代理专为安全而设计,可以从反馈中学习、适应工作流程并安全运行,与 Microsoft 的零信任框架保持一致。在安全团队完全掌控的情况下,代理可以加快响应速度、确定风险优先级并提高效率,从而实现主动保护并加强组织的安全态势,”Microsoft Security 公司副总裁 Vasu Jakkal 在博客中写道。

Red Hat AI 为 Red Hat OpenShift AI 提供新功能

Red Hat OpenShift AI 2.18增加了新功能,例如分布式服务,它允许 IT 团队在多个 GPU 之间拆分模型服务、跨 InstructLab 和 Red Hat OpenShift AI 数据科学管道的端到端模型调整体验以及模型评估。

此版本还包括 AI Guardrails 的预览版,它提供了识别和减轻“潜在的仇恨、辱骂或亵渎言论、个人身份信息、竞争信息或公司政策限制的其他数据”的额外方法。

Akamai 推出全新边缘 AI 推理平台

Akamai推出 Akamai Cloud Inference,这是一款新型解决方案,为开发者提供在边缘构建和运行 AI 应用程序的工具。

Akamai 表示,使用此工具将数据工作负载拉近至更接近最终用户,可使吞吐量提高 3 倍,并将延迟降低 2.5 倍。

Akamai Cloud Inference 提供多种计算类型,从经典 CPU 到 GPU,再到定制的 ASIC VPU。它提供与 Nvidia 的 AI 生态系统的集成,利用 Triton、TAO Toolkit、TensorRT 和 NVFlare 等技术。

由于与 VAST Data 的合作,该解决方案提供了对实时数据的访问,以便开发人员可以加速与推理相关的任务。该解决方案还提供高度可扩展的对象存储以及与 Aiven 和 Milvus 等矢量数据库供应商的集成。

AlexNet 源代码现已正式开源

AlexNet 是一个用于识别图像的神经网络,由多伦多大学研究生亚历克斯·克里热夫斯基(Alex Krizhevsky) 和伊利亚·苏茨克维 (​​Ilya Sutskever )及其导师杰弗里·辛顿 (Geoffrey Hinton) 于 2012 年创建。

“在 AlexNet 之前,几乎没有一篇领先的计算机视觉论文使用神经网络。在它之后,几乎所有论文都会使用神经网络。AlexNet 只是一个开始。在接下来的十年里,神经网络将不断进步,合成可信的人类声音、击败围棋冠军选手、模拟人类语言并生成艺术作品,最终由 Sutskever 共同创立的公司 OpenAI 在 2022 年发布 ChatGPT,”计算机历史博物馆软件历史中心馆长苏汉森 (Hansem Hsu)如此写道,这家机构正在与谷歌合作发布源代码。  

AlextNet源代码可以在这里找到。 


编辑:场长

评论