导读:Google 近日宣布推出Gemini家族的最新型号,以及名为Jules的全新开发者编码Agent。
Gemini 目前有两种不同的型号。
Flash 平衡了性能和速度,Pro 则针对性能进行了优化。据测试最新型号 Gemini 2.0 Flash 的速度是 Gemini 1.5 Pro(2024 年 2 月首次预览版)的两倍,同时还实现了更强大的性能。
具体来讲,它在各种基准测试中提高了多模式、文本、代码、视频、空间理解和推理性能。
Gemini 2.0 Flash 还将提供文本、图像和音频等新输出模式,而 Gemini 1.5 Flash 只能输出文本。图像和音频输出目前在 Gemini 网站上仍列为“即将推出”,但 Google 表示预计将于明年推出。
音频输出支持多种语言,可以用八种不同的声音朗读,并可控制语言和口音。图像输出使用户能够在之前的输出基础上,根据设想对生成的图像进行改进。在 Google 分享的一个演示中,用户利用此功能要求 Gemini 拍摄一辆汽车的照片,并将图像转换为敞篷车。
Gemini 2.0 Flash 还可以使用 Google 搜索等工具,并可以利用第三方功能。Gemini API 集团产品经理 Shrestha Basu Mallick 和 Google 实验室产品总监 Kathy Korevec 在一篇官方博文中写道:“可以并行运行多个搜索,从而通过同时从多个来源找到更多相关事实并将它们结合起来以提高准确性,从而改善信息检索。”
最后,该模型还可以接受音频和视频的流媒体输入,以实现实时、多模式应用程序的开发。
为了帮助开发人员开始使用 Gemini 2.0 Flash,Google 在 Google AI Studio 中发布了三个入门应用体验,用于空间理解、视频分析和 Google 地图探索。
Gemini 2.0 Flash 目前尚处于实验状态,预计将于 2025 年初全面上市。
Jules,由人工智能驱动的编码代理
此外,Google 还推出了一款新的编码代理 Jules,目前可以处理 Python 和 JavaScript 编码任务,例如修复BUG。
Jules 制定了解决问题的多步骤计划,可以一次修改多个文件,并可以准备拉取请求。
Jules 目前仅向一组指定的测试者开放,并将于明年初向更广泛的用户推出。
作者:聆听音乐的鱼
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。