AutoGPT Star 数破10万，这是首篇系统介绍自主智能体的文章

+8613426109659

webmaster@21cto.com

登录注册

AutoGPT Star 数破10万，这是首篇系统介绍自主智能体的文章

场长

人工智能 0 1385 2023-04-26 11:18:16

导读：在 GitHub 上，AutoGPT 的 star 量已经破 10 万。这是一种新型人机交互方式：你不用告诉 AI 先做什么，再做什么，而是给它制定一个目标就好，哪怕像「创造世界上最好的冰淇淋」这样简单。类似的项目还有 BabyAGI 等等。这股自主智能体浪潮意味着什么？它们是怎么运行的？它们在未来会是什么样子？现阶段如何尝试这项新技术？在这篇文章中，Octane AI 首席执行官、联合创始人 Matt Schlicht 进行了详细介绍。

人工智能可以用来完成非常具体的任务，比如推荐内容、撰写文案、回答问题，甚至生成与现实生活无异的照片。你告诉 AI 完成哪一项任务，它就完成哪一项，十分简单。

但是，如果你不想帮 AI 把所有这些任务都列出来该怎么办？如果你更想要一个队友而不仅仅是一个工具怎么办？如果你想让人工智能自主思考怎么办？

想象一下，你创造了一个人工智能工具，可以为其设定目标，即使是像「创造世界上最好的冰淇淋」这样模糊的目标，它也会拟出一个待办事项列表，执行待办事项，并根据进展来添加新的待办事项。随后它会继续重复这个过程，直至完成目标。

这正是「自主智能体」所做的事情。在 AI 开发人员的圈子中，它们的成长趋势是最快的，但迄今为止，大多数人并不了解它们。（在写这篇文章的时候，尚无主流出版物写过关于自主智能体的文章。而且自它面世以来，仅有很少数人报道过它，因此，如果你正在读这篇文章...... 那么你就是最早了解到它的人之一了。）

何为自主智能体？为何它们背后隐藏着巨大的机会？它们是如何运行的？它们在未来会是什么样子的？我怎样才能创造或使用它？

这正是我将为你解答的问题。

「[智能] 自主智能体通常是自动化的自然终点。原则上，智能体可被用于自动化任何其他过程。不难想象，一旦这些智能体变得高度精密、可靠，各个领域和行业的自动化程度将呈指数级增长。」 —— 英伟达机器学习专家 Bojan Tunguz

何为自主智能体？

自主智能体是由 AI 赋能的程序。当给定一个目标时，它们能够自行创建任务、完成任务、创建新的任务、重新确定任务列表的优先级、完成新的首要任务，并不断重复这个过程，直到完成目标。

请再多读一遍上面的描述，它虽然简单，但却很疯狂。

「从自主智能体的发展趋势来看，每个人都有望成为一名经理。」 ——BabyAGI 创始人中岛洋平（Yohei Nakajima）

自主智能体可以被设计用于做任何事情，从管理社交媒体账户、投资市场到制作最好的儿童读物。

「这些是真的吗？现在就能实现吗」

是的，我知道这听起来像科幻小说，但这些都是真实存在的。如果会编码，你可以在几分钟内设计出一个。而这仅仅只是开始。

「人们常常会浪费过多的时间来做繁琐乏味的手工工作，而当计算机可以完成这些工作时，人们便可以被解放出来去实现更具创造性的追求，或者去做目前只有人类才能做的事情。自主智能体将使人们能够在更短的时间内完成更多的工作，并且，随着时间的推移，人们盯着屏幕工作的时间也有望缩短！」 ——Redpoint 常务董事 Erica Brescia

实现自主智能体所需的编程技术和 AI 是非常现实且极其新颖的。许多开源项目，诸如 AutoGPT、BabyAGI 和 Microsoft 的 Jarvis，在 AI 社区、Github 上都很流行。

在创建开源自主智能体代码库的前两周里，有将近十万名开发人员都在构建自主智能体、优化它们、并寻找它们的能力上限，而这些工作也只是在这些概念被发明的前几周所做的。现今，使用该技术的开发人员数量正在以越来越快的速度飙升。

「AI 智能体将无处不在。价值数十亿美元的公司将从会一个部署 AI 智能体的小团队发展而来。」 ——Ben's Bites AI Newsletter 创始人 Ben Tossell

AI 智能体的成长规模已经超过了长期流行的代码库，如 laravel、bitcoin、django 和 pytorch 等。

Auto-GPT Github 受欢迎程度呈指数增长，比历史上任何代码库都快。

这不是科幻小说。许多人认为这些自主智能体才是真正的通用人工智能的开端，又或被称作「AGI」—— 这个术语用于描述已经获得知觉并变得「有生命」的人工智能。

「自主智能体最终可能会将事实性知识的所有应用商品化。如果对事实性知识的获取也变得普遍可用，那么创造力、情感和战略眼光等人类品质将变得更加珍贵、独特。但是，知识也有可能变得越来越专有化，因为个人和公司试图在事实知识的应用商品化、人类集体知识开始停滞的世界中获得经济利益优势。」 —— 前美国联邦调查局新兴技术代理主管、Bondoo AI 联合创始人 Tony Hu

请看一下这个刚刚从 HyperWrite 发布的自主智能体，你可以看到它被安装在了浏览器中，可帮助人们订购比萨。

你只需说「点一份从 Dominos 配送到 One Vanderbilt 的无馅料大披萨」，然后它就可以自己订了。

HyperWrite's 的自主智能体控制浏览器来订购披萨。

或者，看看斯坦福大学和谷歌合作完成的这个实验，他们创建了一个由 25 个自主智能体组成的虚拟城镇，并告诉其中的一个来组织一场情人节派对。这个例子也许更令人印象深刻。

这些自主智能体模拟的人们过着它们的日子，互相交谈，形成新的记忆，最终它们中的大多数都听说了情人节派对，并且最终出席了。

图源：《Generative Agents: Interactive Simulacra of Human Behavior》

所以自主智能体是真实的…… 这就引出一个疑问：只要告诉智能体目标是什么，然后它就会永远自行管理自己吗？

答案是肯定的。

你只需给它定一个目标，剩下的会由自主智能体自己完成。它就像一个非常好的员工或队友。不过，如果你愿意，也可以自行设计自主智能体，使其在某些关键决策时刻与你联系，以便你可以即时协作指导它们工作。

「这是原始 AGI（primitive AGI）。值得注意的是，只需将一个 LLM 包装在一个循环中，就可以获得一个自主智能体，它可以自己推理、计划、思考、记忆和学习。如果包装和 prompts 正确，LLM 可以被激发出无尽的潜能和灵活性。虽然整个概念诞生还不到一个月时间，但我已迫不及待地想看看由 LLM 构建的复杂智能体将如何影响世界。」 ——Runway 创始人兼 CEO 陈思琪

自主智能体除了能分析目标并分配任务之外，它们还拥有一系列能力，例如：

浏览互联网、会使用应用程序；
长期和短期记忆；
控制你的电脑；
运用 GPT 等大语言模型 (LLM) 进行分析、总结，提出意见并给出答案。

此外，这些自主智能体将具有各种形状和大小。有些将在用户不知道他们在做什么的情况下在幕后运行，而有些则是可见的，如上例所示，用户可以跟踪人工智能的每一个 “想法”。

「自主智能体将让每个人都像国家元首一样生活！你只管提出要求，自主智能体就会处理其余的事情。你无需在例行公事或平凡的事情上浪费脑力。」 ——《Blitzscaling 》作者之一 Chris Yeh

接下来我们用一个通俗易懂的示例来说明：假设有一个自主智能体可以帮助研究，我们想要关于某个主题的最新新闻总结，比如说关于 Twitter 的新闻：

我们告诉智能体「你的目标是找出有关 Twitter 的最新消息，然后向我发送摘要」；
因此，智能体在看到目标任务后，借助 OpenAI 的 GPT-4 等 AI，从而理解正在阅读的内容，并提出第一个任务，即「任务：在谷歌上搜索与 Twitter 相关的新闻」；
然后智能体在谷歌上搜索 Twitter 新闻，找到热门文章，并返回一个链接列表。第一个任务完成；
继而智能体回顾它的主要目标（找到关于 Twitter 的最新消息，然后发送摘要）以及它刚刚完成的事情（得到一堆关于 Twitter 的新闻链接）并决定它的下一个任务需要是什么；
之后，它提出了两个新任务：1）写新闻摘要。2) 阅读通过谷歌找到的新闻链接的内容；
现在智能体在继续工作之前停顿了一会儿，它需要确保这些任务的顺序是正确的。确定应该先写摘要吗？智能体否定了，它决定首要任务是优先阅读通过谷歌找到的新闻链接的内容；
智能体从文章中读取内容，然后再次返回待办事项列表。它想添加一个新任务来总结内容，但该任务已经在待办事项列表中，所以自主智能体并没有添加；
智能体检查待办事项列表，唯一剩下的一项就是总结它阅读的内容，所以它这样做了。此时它就会按照用户要求发送摘要。

下图表展示了自主智能体是如何工作的：

图源：Yojei Nkajima 的 BabyAGI

这一新范式刚刚开始，但它并不完美，还未风靡全球，但这个概念非常强大，并且随着不断的发展和实验，它将很快融入到我们的日常生活。

「这将很快改变许多行业。通过使用自主智能体，人们同时可以更轻松地做很多事情。只要给它一个任务，它就会去完成。到目前为止，这是一个非常强大的概念…… 」——The AI Valley Newsletter 创始人 Barsee

在更高程度上理解了什么是自主智能体之后，接下来讨论一下为什么自主智能体能够带来如此大的机会？

让我们深入探讨下吧。

「如果我们能够更快地获得我们需要的信息，这是否会让我们腾出时间来专注于思考和做事？由于这个 AI 智能体可以执行更多任务，人们可以投入更少的时间在那些繁琐的工作上，那么人们是否会出现更好、更有创意的想法？」 ——Octane AI 客户管理总监 Marina Pérez

为何自主智能体能带来如此大的机会

很明显，很快你不仅可以选择雇用人类作为员工，而且还可以以自主智能体的形式雇用 AI。

「过不了多长时间，我相信你会看到结合使用 AutoGPT 和 ChatGPT 等工具的 1 至 2 人的初创公司数量会大幅增加。它们将能够取得你之前对 100 人规模的初创公司所期望的那种进步。从长期来看，我相信大多数工作可以且将被 AutoGPT 取代。」 ——Lore 创始人 Nathan Lands

而且它们不会像雇佣人类一样昂贵，它们不会睡觉、不会辞职，而且会非常高效地工作。

「我在 2013 年创立 Product Hunt 时的部分观点是相信构建软件产品的障碍将继续降低，能够使较小的团队（或单个人）比此前任何时候都更快地创立软件。在人工智能和自主智能体的推动下，这种事情没有任何时候会比今天更为真实。这给一些人带来了焦虑，也给其他人带来了机会，他们利用这项技术以更少的人员和资金来扩展实现他们的想法。最终，消费者将通过企业间不断激烈的竞争和新解决方案的不断提出而受益。」 ——Weekend Fund 和 ProductHunt 创始人 Ryan Hoover

这些自主智能体将存在于每个行业并可运用在每项可以想象的任务中。下图展示的只是少数几个例子：

该列表可以不断加长。人可以做的事情，自主智能体将（最终，但很快，而且在某些情况下已经）能够做得更好。

「音乐行业在艺术家和成功之间强加了太多不必要的事务。这些事务花费了艺术家近 35% 的净收入。自主智能体将能够制定和执行营销策略、与粉丝互动、建立社区、预订场地和谈判合同等。为艺术家节省金钱和时间。」 ——Venice Music 联合创始人、Lady Gaga 前经理人 Troy Carter

该如何抓住机会呢？有两个非常现实的机会。

自己创建自主智能体并让它们可供其他人雇用；

聘请自主智能体，它们现在可以协助提高你的个人生活质量或业务工作效率。

「自主智能体是下一波浪潮 —— 不仅在科技领域，而且在整个商业领域。我预测在 10 年内，将有多家价值数十亿美元的公司完全由自主智能体经营。这是不可避免的。」——Octane AI 联合创始人兼总裁 Ben Parr

想象这样一个世界，其中一个人建立了一家公司，其团队中只有自主智能体。在你的一生中，你很可能会看到一个人的团队能够做到这一点并实现超过 10 亿美元的市值，而这通常需要非常多的人一起工作才能完成。

「大规模个性化将成为一个非常有趣的用例。你将能够独立操控人类今天执行的自动驾驶多步骤流程，包括生成个性化图像、视频、网站、甚至电子邮件甚至大规模呼叫。其中一个能够引起很大兴趣的用例是销售开拓。」 ——Meta 人工智能产品负责人 Omar Pera

现在，在早期阶段，先行者们无论是制造自主智能体还是使用它们，都将在与尚未利用这些系统的竞争者中取得巨大优势。

「在不久的将来，我希望看到午餐会议、电话和采访出现在我的日历上，而无需我参与制定。我的智能体和他们的智能体都能做到这一点，处理好所有细节。我只需要出席即可。」 —— 纽约时报畅销书《WOOL》作者 Hugh Howey

通过阅读这篇文章，你将早已领先于世界 99% 的人。让我们深入探索一下更多关于这些自主智能体如何工作的细节吧。

「自主智能体有潜力增强较小的内容创作者和社区成员的产出，尤其是那些具有创造性想象力的人。这将是许多 Web3 项目的福音。（“Web3.0” 是对现在的互联网的底层协议 “万维网” 的一个衍生。它意味着机器能读懂任何信息，网站可以根据信息提供智能删选和提供更好的信息（人工智能），互联网无处不在（物联网），更重要的是，互联网的数据的所有权将是去中心化的。）」 ——Axie Infinity 联合创始人 Jeffrey Zirlin

自主智能体是如何工作的

你已经大致了解了自主智能体的工作原理，但我认为给你提供一个整体框架版本并逐步分解几个自主智能体示例会很有帮助。

「我现在将 AI 视为一个整体，我们正处在将其演变成人工智能助手的构建阶段，就像我们在电影中看到的那样 —— 比如《钢铁侠》中的贾维斯或《星际穿越》中的 TARS。

现在是构建框架的时候了。因为 AI 本身仍在改进，给出的答案可能不是很完美，还可能有错误。但回顾过去 6 个月人工智能的进步有多大，我想我们几乎无法想象未来 1-2 年的 AI 的进展。所以这是关于尽早、快速地进行试验，放眼未来未雨绸缪的举措。」 —— 微软消费者洞察员 Jenny Reece

以下是一个自主智能体的通用框架：

初始化目标：定义 AI 的目标；
任务创建：AI 检查其记忆中最近完成的 X 个任务（如果有），然后使用它的目标和最近完成的任务的环境来生成新任务列表；
任务执行：AI 自主执行任务；
内存存储：任务和执行结果存储在矢量数据库中；
反馈收集：AI 以外部数据或 AI 内部对话的形式收集对已完成任务的反馈。此反馈结果将用于通知自适应过程循环的下一次迭代；
新任务生成：人工智能根据收集到的反馈和内部对话生成新任务；
任务优先级：人工智能通过审查目标并查看最后完成的任务来重新确定任务列表的优先级；
任务选择：AI 从优先列表中选择最靠前的任务，然后按照步骤 3 中的描述继续执行它们；
迭代：AI 在连续循环中重复步骤 4 到 8，使系统能够根据新信息、反馈和不断变化的需求进行调整。

Octane AI 工程总监 Gabriel Menezes 表示：「自主智能体真的让我着迷，因为它们体现了终极生产力助推器的属性。作为一个高度重视单调工作或重复性任务自动化的人，我发现这些智能体有可能彻底改变我们的工作方式，使我们能够将我们的精神能量转向更有意义的追求。」

示例展示

示例 1：社交媒体管理器自主智能体

假设你不想聘请社交媒体经理来管理你的社交媒体帐户，而是希望自主智能体以极低的成本和全天候的智能为你做所有事情。

「这不仅仅是虚拟助手。这是一场加速所有在线工作、研究甚至娱乐的革命。以前需要花费数小时、数天、数月才能在网上完成的事情，现在可以在几分钟内在后台完成。」 —— 斯坦福大学 CS 教员和谷歌前机器学习产品经理 Sharon Zhou

下面是自主智能体框架可能的样子：

初始化目标：设置初始参数，例如目标受众、社交媒体平台、内容类别和发布频率；
数据收集：收集有关过去社交媒体帖子、用户互动和平台特定趋势的数据。这可能包括点赞、分享、评论和其他参与度指标；
内容分析：分析收集到的数据，以确定与目标受众相关的模式、热门话题、主题标签和影响者。此步骤可能涉及自然语言处理和机器学习技术，以理解内容及其上下文；
内容创建：根据分析，生成内容创意并创建适合平台和受众偏好的社交媒体帖子。这可能涉及使用 AI 生成文本、图像或视频，以及合并用户生成的内容或来自其他来源的精选内容；
日程规划：根据平台具体的趋势、受众活动和所需频率确定发布每条内容的最佳时间。相应地安排帖子；
性能监控：根据参与度指标（例如点赞、分享、评论和点击率）跟踪每个帖子的表现。如果可能，收集用户反馈以进一步完善对受众偏好的理解；
迭代和改进：分析性能数据和用户反馈以确定需要改进的地方。更新内容策略、创建和计划流程以纳入这些见解。反复执行步骤 2-7 以不断完善社交媒体管理系统并随着时间的推移提高其有效性。

「人们将拥有个人智能体从而与其他人以及企业拥有的智能体进行通信。大多数计算设备将主要用作与智能体交谈的通信设备。」 ——Stability AI 高级软件工程师 Conner Ruhl

通过将这种循环型系统纳入社交媒体管理，你可以创建一个动态的自适应策略，随着受众的偏好和不断变化的社交媒体环境而演进。这将有助于提高社交媒体工作的参与度、影响力和整体有效性。

「另一个让我兴奋的自主智能体用例是它在音乐创作领域的应用。通过利用 AI 驱动算法的能力，这些智能体可以分析我的个人喜好、最喜欢的流派，甚至是与我产生共鸣的特定音乐元素。然后它们可以生成原创的旋律、和声和节奏，与我一起有效地共同创作音乐。这种创造性的合作有可能拓宽我的音乐视野，使我能够探索以前可能没有考虑过的新风格和流派。此外，自主智能体可以对我的作品提供有价值的反馈并提供改进建议，培养我成长为音乐家。人工智能与人类创造力在音乐创作过程中的融合可以带来创新和独特的结果，扩大艺术表达的界限。」 ——Octane AI 产品总监 Katya Sapozhnina

示例 2：能够竞选职位的自主智能体

如果你正在竞选一个职位并且想利用 AI 助手来获得帮助。

我希望智能体做的工作不必很难，但这些工作需要花费一些时间和精力。例如预订航班之类的事情，我很乐意外包给智能体。」 ——Gumroad 创始人兼首席执行官 Sahil Lavingia

初始目标：通过确保大多数选票赢得选举；
数据收集：收集有关选民、人口统计、关键问题、竞选信息和其他相关信息的数据；
背景分析：分析收集的数据以确定趋势、机遇和挑战。根据此分析将初始目标细化为特定的子目标，例如针对未定的选民、增加关键领域的选民投票率或改善针对特定问题的竞选信息；
任务生成：生成与细化子目标相关的任务，例如规划选民外展活动、创建有针对性的广告或制定政策建议；
任务执行：执行最高优先级的任务，根据需要分配资源和分配团队成员；
绩效监测：通过跟踪选民参与、公众舆论和筹款指标等关键绩效指标来评估已完成任务的有效性。评估单个任务的成功和整个活动在实现子目标和初始目标方面的进展；
迭代和改进：分析性能数据以确定需要改进的地方，并结合这些洞察结果来更新活动策略。重复步骤 2-8 以不断完善竞选管理系统，并随着时间的推移不断提高其有效性。

「我对递归自我克隆能力感到非常兴奋。AI 智能体可以创建自己的副本，传递任务指令，并开始与自己的兄弟姐妹交谈以完成工作。这是一种非常了不起但又奇异的涌现能力。」 ——NVIDIA 人工智能科学家 Jim Fan

起初，有一个竞选者可能会使用一个自主智能体，他会比其他人拥有巨大 D 优势，但是想象一下，一旦每个竞选者都有一个…… 或多个智能体，那会是什么样子。

「我不认为每个人都会使用自主智能体。尽管它们无处不在，但随着人工智能的发展，人类参与的工作将会复兴。许多人会重新想到笔和纸，想要人类制造的艺术品…… 我们会看到许多产品和创作标榜 “完全由人类自己制造”。它应该很快成为一个非常受欢迎的标签。技术发展得越快，我就越享受长时间完全离线的时间，很快也会享受 “脱离 AI” 的时间。」 ——PAWA 创始人兼首席执行官 Loic Le Meur | Loic

示例 3：教授数学的自主智能体

这里还会有设计用于教授孩子们数学的自主智能体。

「这是一个具有很大探索空间的突破性范式。尽管早期实验限制了智能体搜索查询，但我们将看到大范围的研究和辅助项目为自主智能体配备新的工具。而每套工具都将显著地扩展其潜在用例。」 ——Pete Huang，The Neuron Daily AI 时事通讯创始人

初始目标：确定孩子当前的数学技能水平并设置个性化的学习路径以帮助他们提高；
数据收集：通过评估、互动和反馈收集有关孩子的学习方式、学习过程和学习表现的信息；
上下文分析：分析收集到的数据，以确定孩子的优势、劣势、学习偏好，以及影响孩子进步的所有外部因素；
任务生成：根据孩子的需求和学习路径生成辅导任务，例如选择合适的练习题，提供讲解，或提供现实生活中的例子和应用；
任务优先级：根据辅导任务对孩子学习和技能发展的潜在影响对辅导任务进行排序，找到挑战性与参与感之间的平衡；
任务执行：执行最高优先级的任务，根据需要调整辅导方法和内容传递，以最大限度地提高孩子的学习掌握度和参与度；
绩效监测：通过跟踪关键绩效指标 (KPI) 评估辅导的有效性，例如学习目标的进展情况、数学技能的提高以及孩子的参与度和满意度；
反馈循环：持续监测孩子的表现，并根据新数据和见解更新上下文分析、任务生成和任务优先级排序步骤。根据需要调整初始目标和学习路径，以更好地支持孩子的数学技能发展；
迭代和改进：分析孩子的表现并根据新数据和见解更新上下文分析、任务生成和任务优先级排序步骤。根据需要调整初始目标和学习路径，以更好地支持孩子的数学技能发展。反复执行步骤 2-9，以不断完善教育管理系统并随着时间的推移提高其有效性；

这种自主智能体循环类型系统概述了教学中数学导师自适应帮助和指导孩子学习体验的过程，重点是根据孩子的需要和进步不断改善并提供个性化指导方案。

自主智能体的未来

现在人类正处于开发自主智能体的最初阶段。我们四处探索、打破一些事物、进行试验、创造或好或坏的事物。

「通过请求自主智能体的帮助，它们将会把你的想法变为现实。这些智能体可以充当朋友、同事和合作者，为你提供充裕的休闲时间。我很想知道，你会选择如何度过这种新寻得的自由时间？」 ——Glasp 联合创始人兼首席执行官 Kazuki Nakayashiki

现在，几乎没有任何商业化的自主智能体产品发布，这类产品仍处于开发阶段。但很快，这种情况就会改变。自主智能体将开始出现在各个地方。

「与其专注于取代人们的工作，不如专注于增强它们的能力。使某物『智能』在过去意味着通过 API 来使其数据可用。而下一代的智能化将是询问该产品如何更好地帮助你。例如，『智能』电子邮件地址可能能够根据你的偏好以有趣的方式采取行动。如果你是一个购物迷，也许它会监控电子邮件，了解你感兴趣的商品何时开始销售、进行价格比较，甚至代表你协商价格，私下了解你对商品的估价以及你乐意为其花费的价钱。」 ——Factorial Capital 管理合伙人、HuggingFace 投资人 Matt

人们将通过各种自主智能体来增强他们的活动、决策和行动。如果在未来某个时候我们有神经植入物，那么这一切都会自然地发生，就像今天在你自己的头脑中思考一样。

「每个人都可以免费或花很少的钱接触到虚拟研究员、助理、作家或工作人员。这种接触是普惠化的。」 ——Jeremiah Owyang，人工智能投资人

以下是我对自主智能体未来的预测：

2023 年出现用于游戏、个人使用、营销和销售的多个商业化自主智能体；
2024 年出现各个类别的商业化自主智能体，但并未得到主流采用；
2025 年在每个类别可以想象到的事情中普遍采用自主智能体；
2026 年第一世界国家的大多数人每天都在大量自主智能体的协助下过着日常生活；
在接下来的 2-5 年内，大多数人将为自主智能体工作而非人类。

「我看到使用增强现实的 Holodeck（全息甲板），几乎完全由 AI 驱动，其中很多事情都在自动和手动提示下发生。是的，人们将为 AI 工作。每个人都会使用它们，但只有少数人知道它们是什么或如何制作它们。由于大型语言模型（LLM）和即将到来的自主智能体和系统不断出现，世界即将发生深刻变化。

LLM 是人类发明的最普惠化的力量。为什么？LLM 现在可以在廉价计算机上运行，而无需连接到中央服务器。那个小引擎基本上包含了所有人类知识。令人难以置信的是，你可以在未连接到互联网的设备上运行它。自主智能体只是让这个全息甲板近乎自动运行。从天气到披萨外卖，一切基本都是自动发生的，几乎不需要人类输入的干预。」 ——Infinite Retina AI-First 首席战略官 Robert Scoble

未来将是疯狂的。那么如何构建和使用自主智能体呢？

「在这个未来，每个人都可能会以某种身份使用自主智能体，无论是为了个人生产力、业务运营还是创作活动。在大多数情况下，人们将充当这些 AI 智能体的『大师』，为它们设定目标并推动它们前进。我们也将『为 AI 智能体工作』，就像我们必须在公司、流程和其他系统的约束下工作一样。然而，我认为 AI 智能体在许多情况下会比当今社会上的公司和系统做得更好，并且会创造让所有人受益的机会。」 ——Crowd Cow 联合创始人 Joe Heitzeberg

如何构建和使用自主智能体

你现在已准备好一头扎进自主智能体的世界。我将为你列出开始构建或使用自主智能体代理所需的资源。

「找到一个包含大量重复性任务的特定 B2B 用例。如销售运营、广告运营、项目运营、会计服务等。现在可供选择的任务很多。」 ——Hustlefund 联合创始人 Elizabeth Yin

「首先，尽可能缩小你的用例范围。然后，设计一种包含人机回环（ human-in-the-loop）的产品，以及一种评估过程成功与否的方法，并逐步增加自动化程度，最后再扩展到相邻的用例。」 ——Codium AI 联合创始人兼首席执行官 Itamar Friedman

构建自主智能体

构建自主智能体有几个不同的选择。

自己构建：看看我之前提供的框架，然后从头开始构建一切的旅程吧！这并不像听起来那么可怕。推荐使用的软件解决方案有 OpenAI 的 GPT-4、Pinecone 矢量数据库和 LangChain 的框架。
Auto-GPT：这是一个流行的开源选项，由 Toran Richards 创建。它包括连接到互联网、使用应用程序、长期和短期记忆等选项。
BabyAGI：另一个流行的开源选项，由 Yohei Nakajima 创建。虽然这个还没有连接到互联网，但它的代码不到 200 行，非常简练。
Microsoft 的 Jarvis：与 Auto-GPT 和 BabyAGI 非常相似，但更强大，由 Microsoft 和 HuggingFace 提供。

「我认为我们最初将拥有垂直领域的自主智能体。这些智能体针对一组特定数据进行微调，使它们能够在该领域发挥作用。到目前为止，我们看到大量运用大型语言模型（LLM）的（仅有的？）两个领域是文案写作和编程。进一步推断，我们认为这两个领域采用的 AI 将开始变得更加自主是有道理的。一种可能在不久的将来逐渐出现的方式是，人工智能将代替人们给出 prompt 来触发文案写作或代码编写，它们将每天自动给你新的建议供你考虑，而不需要你先启动它们或给它们 prompt。」 ——godmode.space 的创建者 Lonis Hamaili

使用自主智能体

准备好拥有自己的智能体了吗？这里有一些选项。

你可以通过选择任一选项来创建如上所述的自己的智能体！

AgentGPT：从网站创建并运行自主智能体 (AutoGPT)，无需登录。
HyperWrite Assistant：添加一个 chrome 扩展程序，让你可以向浏览器发出命令，然后浏览器执行。

「各行各业的人们都可以从此前专为社会精英阶层保留的专业知识和高效方法中受益。这种个人助理的普惠化可以带来更高的生产力和更平衡的工作与生活体验，使人们能够更专注于他们的兴趣、创造力和个人成长，而他们的人工智能助手则负责处理他们日常生活中更单调的部分。」 ——HyperWrite 创始人兼首席执行官 Matt Shumer

无论你会不会编程，我都鼓励你花几个小时来尝试这些东西。它并不像看起来那么复杂或困难，而且你越快动手，你就会越快地了解自主智能体。

「作为一名投资者，使用自主智能体来完成分析师和助理的工作，或至少极大地助力他们的工作，这让我非常兴奋。它们可以在特定条件下通过编程寻找交易，针对特定因素进行分析，然后帮我发送自定义电子邮件以开始对话。」 ——Boost VC 联合创始人 Brayton Williams

自主智能体如今可被进行开放式的诠释和创新。99% 的用例尚未创建或尝试，拥有无穷无尽的可能性，而机会就在你的手中。

「对于为实现更大的终极目标而对较小的编程任务进行编排和模块化，我非常感兴趣。我们知道大型语言模型擅长基于问题进行编程，但我们还未看到证据表明它们可以将整个代码库从 Android 移植到 iOS，甚至可以从头开始创建应用程序。我认为具有正确编排方案和内存结构的智能体或可实现这一目标。」 ——Curai 联合创始人兼首席执行官 Neal Khosla

来源：选自Matt Schlicht's AI Newsletter
作者：Matt Schlicht
编译：机器之心
编辑：王楷
原文链接：
https://www.mattprd.com/p/the-complete-beginners-guide-to-autonomous-agents?continueFlag=d7ee95bb4d852ef440fb8296d95c54e6

本篇文章为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

场长

标准用户

AutoGPT Star 数破10万，这是首篇系统介绍自主智能体的文章

评论

场长

最新文章

Vibe Coding？这里有你需要知道...

JetBrains 正式发布了 Kotlin 2....

英国军情第六处处长：我们将像精...

PHP 8.5 与 PHP 8.3 和 Node.js...

印度发布一款自主研发的双核 1GH...

日本科学家本田崇人发布“Sui”编...

微信团队就 “微信群崩了” 致歉

AI 的矛盾：促进软件开发，也在...

WSL 2.7.0 发布，在 Windows 上...

RMS：别把 ChatGPT 当 “智能”，...

我要赞赏作者