21CTO 导读:目前,所有OpenAI的API付费用户(有成功支付历史的)都可以访问拥有8K上下文记忆的GPT-4。
OpenAI 本周四(7月6日)宣布,其最新的大型语言模型GPT-4将通过其API正式开放使用。
目前,所有OpenAI的API付费用户(有成功支付历史的)都可以访问拥有8K上下文记忆的GPT-4。另外,该公司计划在本月底向新的开发人员开放API访问权限,然后通过算力可用性来调整可用性限制。
这意味着全球开发者都能使用到GPT-4大型语言模型,来增强自己的应用程序或开发全新的生成式AI应用了。
OpenAI在一篇博客中写道,“自3月份以来,数以百万计的开发人员访问GPT-4 API,利用GPT-4的创新产品的范围每天都在增长。”
今年3月,OpenAI正式发布GPT-4,该模型可以接受图像和文本输入来生成文本(包括代码),并在各种专业和学术基准上达到“人类水平”,这是对其前身GPT-3.5的改进,后者只接受文本输入。与过往GPT模型一样,GPT-4是使用公开可用的数据进行学习训练的,包括来自公共网页的数据以及OpenAI许可的数据。
GPT-4在上下文窗口方面保持了之前的领先性,默认为8k个token(token是模型处理文本的基本单位),上限为32k个token。一般来说,上下文窗口更大的模型越能记住最近对话的内容,而窗口较小的模型在对话过程中容易丢失上文内容,导致它们偏离聊天主题。
支持任何用例
OpenAI 文章指出,“我们设想未来基于聊天的模型可以支持任何使用案例。”
OpenAI还计划推出GPT-3.5 Turbo,DALL·E和Whisper的API接口。GPT-3.5 Turbo是OpenAI的另一个文本生成模型之一,但功能较GPT-4较弱;DALL-E 2是OpenAI的图像生成模型;而Whisper是该公司的语音转换文本模型。
目前图像理解与分析功能还没有提供给所有OpenAI的客户。据悉,OpenAI正在与一家名为“Be My Eyes”的合作伙伴进行测试,但它还没有表明何时会向更广泛的用户群开放。
OpenAI还表示,在未来它将允许开发人员用自己的数据微调GPT-4和GPT-3.5 Turbo,这一功能或将在今年晚些时候全面实现。
即将淘汰和替代的API
值得注意的是,即使是当今最好的生成式人工智能模型之一,GPT-4也仍不完美。它还会对事实产生错误认知,有时还会“很自信”地犯一些推理错误,并在一些复杂问题上出现了失败。
对此,OpenAI宣布将在Completions API中淘汰几个旧版模型,未来的模型将侧重于Chat Completions API,作为该公司优化计算能力的一部分。
下图是OpenAI宣布淘汰的旧模型,以及替代它们的新模型:
OpenAI在6个月内会淘汰这些Completions API的旧型号,目前旧API仍然可以访问,从今天开始,该公司将在开发文档中将其标记为“遗留”。从2024年1月4日开始,旧的Completions API将不再可用。
GPT-4 主要功能介绍
1 创造力
GPT-4比以往任何时候都更具创造性。可以生成、编辑并与用户一起迭代创意和技术写作任务,例如,创作歌曲、编写剧本或学习用户的写作风格进行生成内容。
2 视觉输入
GPT-4可以接受图片作为输入并生成说明、分类和分析。例如,输入一张包含鸡蛋、面粉的图片,然后加上一句“我用这些原料可以做什么?”
ChatGPT会回答:你用这些原材料可以做很多选择:煎饼或华夫饼、可丽饼、法式吐司、 煎蛋卷或菜肉馅煎蛋饼、乳蛋饼 奶油冻或布丁、蛋糕或纸杯蛋糕、松饼或面包、饼干。
这只是几个典型的例子,人们发挥想象可能做更多的东西。
3 更长的上下文处理
GPT-4能够处理超过25000个单词的文本,允许使用长格式内容创建、扩展对话以及文档搜索和分析等用例。例如,可以直接将链接加入到提问内容中。
更安全的ChatGPT
根据OpenAI的说法,GPT-4比以前的任何AI系统“更具创造力和协作性”,具有更广泛的知识库,并且更擅长解决问题。
特别是GPT-4作为一个多模式系统,除了处理文本之外,它还接受图像作为输入。
GPT4在结构化问题解决方面实现了突破。它目前可以提供分步式说明,例如可以回答如何清洁水箱的系列方法。
在模拟律师考试中,GPT-4在考试中达到了排名前列。
GPT-4目前可以处理超过25000个单词,更加适合生成成更大的文档和分析数据。OpenAI亦表示,其数据是截至在2021年3月,GPT4将不会在自己的经验中学习,新的GPT5将成为全新系统测试运行。
OpenAI表示,新的AI系统是基于对抗型测试中学习经验,还有对ChatGPT的数据反馈。该公司说GPT4在事实准确以及可操纵性方面优于前一版本GPT3.5。
GPT-4在常用的机器学习基准测试中,也比3.5高出16%,在多语言任务上比3.5高出15%。
OpenAI表示,该公司团队开发的预测GPT-4在某些领域的全新方法,使用的模型计算量仅为GPT-4的千万之一。
在AI能力与安全方面,OpenAI表示还待解决:“我们正在积极努力,加大开发方法,为社会提供更好的指导,以了解对未来系统的预期,我们希望成为人工智能领域的共同目标”。
输入与性能
GPT4最显著的功能是能够将图像做为输入源处理。例如,它可以使用图像输入来解析建模,或者图片主题的独特数据,它能够逐步分解信息图表,并且能够科学计算相关的图表,并可以解释它的各个方面。
在权威的基准测试中,GPT-4的性能已经优于其它现有文本图像模型。而且,GPT-4可以通过视觉解决新的以及更令人兴奋的新任务。
GPT-4会根据API的传入消息,确定模型反应的特征,是更像好莱坞演员,还是以苏格拉底哲学家的方式互动。
GPT-4仍然存在的限制
GPT-4在推理与多模态方面取得了重大进步,但仍然存在与之前版本的局限性。包括:
1)仍然不可靠,容易产生幻觉
根据OpenAI内部对抗型测试中,GPT-4的平均性能已经超过GPT-3高出5.3%,平均准确论在70%到80%之间。
2)仍会持续制造偏见和强化现有偏见
OpenAI承认还有很多工作要做,该公司宣布可定制的人工智能语言模型计划,这些模型可以反映更多不同类型用户的价值,可以代表最大化的意见多样性。
OpenAI指出,已经明显提高了模型对查询的案例性,避免违反自己制定的内容政策。GPT4相关查询养活了82%。比如医学主题相关的内容,其准确性比上一版本提高了29%。
『我们花了6个月的时间,让GPT-4更安全,更一致。在我们的内部评估中,GPT-4不响应不被允许的请求降低了82,产生事实性回的可能性提高了40%』。
GPT-4通过ChatGPT Plus会员开发,API通过候补名单发布
OpenAI最初向ChatGPT Plus的付费客户提供GPT-4。该服务每月收费 20 美元,可在国际互联网上使用。与以前的模型一样,开发人员将通过API获得访问权限。
GPT-4 的上下文长度限制为大约 8,000 个Token,或者大约 25,000 个单词。还有一个版本可以处理多达 32,000 个Token,或大约 50 页单词,但 OpenAI 目前似乎对其限制访问。
其价格明显高于 ChatGPT 和 GPT 3.5。最便宜的 gpt-3.5-turbo 每个Token的成本为 002.1000 美元。
微软的新版本Bing当前运行的是GPT-4。这也有一个候补名单可以加入,但与 ChatGPT Pro 不同,这是免费使用的。
ChatGPT正在规模化应用
已有大量企业通过GPT-4打造生成式AI应用。
梅赛德斯-奔驰正在其MO360智能生产系统中测试ChatGPT,用其以改进生产流程,实时数据分析并优化质量管理。该公司的技术团队正在通过Microsoft的Azure OpenAI服务集成ChatGPT,利用云和AI平台的企业功能。
ChatGPT 使用来自生产和开发的客户体验和质量数据来快速识别和分析潜在问题,提高梅赛德斯-奔驰为没有编程知识的员工进行质量管理和流程优化的效率。成功完成试点后,该工具将在梅赛德斯-奔驰的全球生产网络中实施。
此外,摩根士丹利通过GPT-4来管理、搜索其庞大的财富知识库。作为财富管理领域的领导者,摩根士丹利维护着一个内容庞大的财富库,其中,包含数十万页的知识和见解,涵盖投资策略、市场研究和评论以及分析师见解等。
该公司的大量信息分布在众多内部网站上,主要是PDF 格式,需要顾问浏览大量信息才能找到特定问题的答案——这样的搜索既费时又麻烦。摩根士丹利将GPT-4嵌入到内部机器人中,可以帮助财务人员快速找到想要的资料并节省大量时间。
作者:洛逸
本文为 @ 寂静日光 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。