导读:继 3 月份发布新的 GPT-4 引擎和 Whisper API 之后,OpenAI 周四宣布已开始为 ChatGPT 引入插件体系。
OpenAI CEO 奥特曼于23日在Twitter中宣布 :ChatGPT 中实现了对插件的初步支持。
以下为它的演示视频,可点击播放:
OpenAI 创始人还演示了用于处理视频剪辑的插件,不再需要 ffmpeg。
OpenAI 的插件 (Plugins) 是专门为语言模型设计的工具,它以安全为核心原则,可帮助 ChatGPT 访问最新信息、运行计算或使用第三方服务。
这表示,第三方开发者能够为 ChatGPT 开发插件,以将自己的服务集成到 ChatGPT 的对话窗口中。
从上面的演示来看,首批开放可使用的插件包括了酒店航班预订、外卖服务、在线购物、法律知识、专业问答、文字生成语音,以及用于连接不同产品的 Zapier 等。
假设,各位想开发一个用户可以与之交谈的聊天机器人。
在最新的 GPT-4 升级之前,聊天机器人只能讨论过去发生的比赛和比分,特别是在 2021 年,也就是 GPT-3 的训练数据被收集起来的时候. 它不会提取实时数据,甚至不会意识到 2022 年的存在。
而使用 chatGPT 的插件机制,开发者将能够将 ChatGPT 功能附加到现有的代码堆栈中,在那里它将能够执行从检索实时信息调用(体育比分、股票价格、突发新闻)到提取特定知识库的任何事情信息,例如公司的内部文件或来自你的个人云。
它甚至可以代表用户采取行动,例如预订航班或订购外卖。
“人工智能模型充当智能 API 调用者。给定 API 规范和何时使用 API 的自然语言描述,该模型会主动调用 API 来执行操作,”OpenAI 团队这样解释道。“例如,如果用户问,‘我应该在巴黎住几晚?’,该模型可能会选择调用酒店预订插件 API,接收 API 响应,并结合 API 生成面向用户的答案数据及其自然语言能力。”
OpenAI还指出,使用插件来弥合模型的训练内容和之后发生的事情之间的知识差距,应该有助于减少人工智能在回答复杂问题时产生幻觉的倾向。该团队写道:“这些参考不仅增强了模型的实用性,而且还使用户能够评估模型输出的可信度并仔细检查其准确性,从而有可能减轻与过度依赖相关的风险。”
OpenAI 官方现在为开发者提供了两款插件:Browsing 和 Code interpreter。此外还开源了知识库类型插件的全流程接入指南:
ChatGPT Retrieval Plugin
地址:https://github.com/openai/chatgpt-retrieval-plugin
1、Browsing 插件
该插件会利用 New Bing 的 API,在互联网上实时搜索问题的相关信息,然后给出具体答案。
下面这个视频,主要演示了几个功能:
需要注意的一点是,这个插件只支持 GET 请求,不支持 POST。只能用于获取数据,不能用于发送。
这也是 OpenAI 从安全角度出发,做的一些限制。
另外,那些做了爬虫限制,拥有 robots.txt 文件的站点,OpenAI 也会遵守约定,避开那些禁止抓取的内容。
2、 Code interpreter
Code interpreter是一个编程插件:翻译过来叫代码解释器,它用了尚处于实验阶段的 ChatGPT 模型。
该模型被放置在一个受防火墙保护的沙箱中,并会分配少量的临时磁盘空间。
在用户进行对话交流时,代码会保存在持续会话中,交流不中断的情况下,可随时调用。
下面这个视频,主要演示了三部分内容:
通过函数来生成与修改图表;
解析 CSV 文件内容,并获取、分析表格数据、生成可视化图表;
上传图片,动态调整图片大小、灰度、色调,并生成下载链接。
这款代码解释器以下几点比较好用的功能:
解决定量和定性的数学问题;
进行数据分析和可视化;
快速转换文件格式。
随着使用人群的增加,这款代码解释器的更多用途功能会被慢慢挖掘出来。
综合以上信息看出,ChatGPT不仅提供服务,还正在创建一个生态系统,使开发人员可以为用户创建和分发他们自己的插件。
这类似于Apple的App Store通过允许第三方应用在其设备上繁荣起来,从而革新了移动行业。ChatGPT的插件功能未来可能会为人工智能聊天开启新的可能性和市场。
功能目前还在测试,有兴趣的开发者可以先报名然后等待邀请:
传送门:https://openai.com/waitlist/plugins
作者:场长
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。