Siri 联合创始人：我对AI和人机交互的看法

17611538698

webmaster@21cto.com

登录注册

Siri 联合创始人：我对AI和人机交互的看法

万能的大雄

资讯 0 1139 2022-08-09 11:03:18

语音助手 Siri 的联合创始人、现任三星战略与创新中心首席技术官兼高级副总裁 Luc Julia 解释了为什么人机交互引起了他的兴趣，讨论了 Siri 后端是如何在 Apple 构建以及分享他对人工智能未来的愿景。

玩个人电脑

所以，当我还是个孩子的时候，最先开始玩电子产品，然后在大约 15 岁的时候电脑出现了。我开始玩电脑——当时的第一台电脑，个人电脑——PC。而且你知道，我开始后也再没有停止。当时只有 BASIC 语言可用，但我用的是汇编语言，用它编程。

人机交互

后来有趣的发现，计算机是否可以与人类对话，或者人类是否可以与计算机对话。所以我当时做了所谓的HCI——人机交互。比如做一些信号处理，因为当你想让电脑和你说话的时候，你需要让电脑去抓，抓取信号理解信号。

语音识别和手势识别以及一切识别都是我的专长。然后，它后来变成了人工智能，因为当你开始理解信号时，这就是人工智能。

我在法国攻读博士学位，后来在麻省理工学院和斯坦福大学做博士后。实验室里的一些人决定是时候创建一家公司，因为技术看起来已经足够好了。所以 SRI [斯坦福研究所] 是一个衍生工厂！

我后来开始研究所谓的多模态，它基本上是试图将所有模态放在一起，以便为计算机创建消息。语音是最简单的一种，因为当时在计算机中安装麦克风比摄像头更容易。

但这些并不意味着识别语音很容易，因为即使在今天，语音识别也很棘手——不是对单词的识别，而是对意义的识别，这就是所谓的“自然语言”。

互联网作为游乐场

在 SRI，我们进行了一些应用研究，比团队中的其他任何人都更实用。我们推出了 CHIC [计算机人机交互中心]——它是一个应用实验室，我们在那里创造了一堆产品。

在 2000 年，1999 年，我认为它已经足够好了，现在可以进入现实世界来创造开始。

1999 年那是互联网的早期时期，用真人测试产品更容易，因为你只需要把它放到互联网上让人们和机器一起玩。

Siri的诞生

回到 1997 年，那是互联网的开端。是的——全球互联网，对吧？

所以它开始发展起来了，当时还没有谷歌，真的没有办法在互联网上找到东西。我们认为看看你是否可以使用语音找到一些东西是个好主意。这就是个人助手的想法——它帮助我们找到正确的信息。

我花了很长时间研究——直到 2007 年，该产品才准备就绪，当时 Adam Cheyer 创建了它的公司 Siri。他们围绕这个语音助手创建了一个产品。iPhone 也是在 2007 年推出的，所以很自然地用它说话，因为这部新手机里有一个很好的麦克风，

为 Siri 构建后端

Cheyer 找我回来，意思是我们共同培育自己的孩子。

后来这家公司的 Siri 拥有大约 150,000 名用户——150,000 名用户！

我的意思是，你基本上可以用家用服务器做到这一点，所以没关系。后来开始与 Apple 合作，我们知道将拥有 3 亿用户——比 15 万用户显示要困难一些。

因此，挑战在于确保系统具有可用性可可扩展性，并且我们能够提供必要的性能。因为当用户拥有语音识别器时，还需要能够始终为TA提供良好的响应时间。

我有机会负责 Siri 方面的一切——一切的价值。当然我们只看到接口部分，语音接口，但是服务器是很多的，后端也很多。

这是一个非常复杂的系统，有一个庞大的后端。iTunes 基本上“只是”存储，我们也需要大量的计算能力来运行 Siri。我们从头开始构建完整的后端。

从物理构建它——购买服务器，购买实际的数据中心本身——意味着到处都是挑战。看看 Siri，它有大约 17 项服务。当用户查看 Apple 的 Siri 时，它有大约有 5 项服务，当然我们希望添加越来越多的服务。

在惠普引入敏捷开发方法

当我去 HP [Hewlett-Packard] 时，大公司的资源是丰富的。第一天，他们给了我 250 人，250 名工程师，这大约是我过去的 10 倍。

所以它的管理是和初创公司不同的。再说一遍，这是在 2010 年，10 年前的 2010 年，一家大公司里我们所说的敏捷方法是不存在，它使用的就是瀑布方法研发，这意味着您提前六个月的计划——这是很多人不希望在现代软件中发生的事情。

我在那里向高层介绍的东西之一就是敏捷，所以有 250 人不习惯它是一个挑战，但这是一个非常有趣的挑战。我们还开发了一款与惠普不同的新产品。惠普非常擅长打印机之类的，但它不知道连接的打印机可能是什么。因此，我们创建了现在称为 ePrint 的第一台联网打印机，第一年我们实际上售出了大约 8000 万台。

在巴黎开设三星人工智能实验室

今天有一个叫 SmartThings 的东西，三星几年前收购的，它也有后端。

后端基本上是允许存在云的东西——即物联网云。物联网云允许用户连接三星设备以及一些其它非三星设备。这是一个非常异构的环境，所以需要确保所有设备都可以相互通信。我们为此工作了 5 年。

另外，我想在巴黎这里开个分布，于是我们在 2018 年 6 月开设了三星的 AI 实验室。我相信法国工程师品质非常好。

法国有很多初创企业，尤其是现在的巴黎。当我还是学生的时候，放学后工程师们都直接为大公司工作。

我最近听说那些工程学院的 60% 学生现在想创业或为初创公司工作。所以有一个更加动态的环境，这也意味着这些人会看到一些东西——他们愿意，我不会说更有能力，但他们会接触到更多的东西。所以他们在我们提出的项目方面会更加灵活，这就是我喜欢法国工程师的原因。

人工智能的生态成本

AI 其实也很容易，因为你可以在一堆 CPU 和 GPU 或任何 PU 上扔去大量数据，你就可以得到一些结果。

你可以尝试，你可能失败，然后再试一次，实际上你会使用大量资源，特别是在存储方面，你正在使用的数据，还是在计算能力方面，因为你会进行不同的试验。

我注意到很多并没有真正关注，还有那些 CPU 和内存资源，它们在数据中心是看不见的，你自己感觉不到它们。我的意思是，有时候当你身边有自己的电脑时，你会意识到它们确实在工作，它们创造了一种温暖的环境，所以你会意识到它们。

但是当你使用 AWS 或 Microsoft Azure 或其他任何云时，你不会注意到这一点。

所以我说AI太容易了，而且你没有意识到你实际使用了多少能量来帮你正在做的事情，所以在某些时候，你需要——我们需要——清醒过来。

这就是为什么我总是试图解释需要非常小心，我希望人们会变得更加小心。我坦率地说，因为越来越多地鼓励我们使用这些资源，但需要实施一些法律法规。

人工智能的未来

早在 90 年代，我们谈论的第一个助手是语音助手，但现在我们将得到一个全能助手。

这将是一堆助手，因为不会是一个通用的人工智能。我不相信这会发生，现在只是按照今天的方式使用数学，而每个领域都会产生一堆助手。

所以我们将看到医疗领域的助理，我们将看到交通领域的助理。我们将到处看到人工智能。比如在医学领域——你知道 DNA 是非常非常有趣的东西。所以我们将看到 DNA 被解码，它可以用来通过机器学习帮助修复问题，通过深度学习，通过很多数据。这是很多有趣的统计数据。所以当然所有领域都会看到越来越多的AI助手。

有些人正在考虑其他事情——比如正在考虑用量子计算来做物理学。

而我们正在考虑用生物计算来做生物学。

所以现实情况是，这些事情仍处于早期阶段。量子计算也许不那么早，但它仍然非常非常年轻。而使用生物学计算，我们将无处可去。

如果我们相信，有朝一日，我们将创造出与人类自己的智力相近的东西，那就是某些人所说的一般智力，它不会通过数学来实现。

我不认为它会与物理有关，因为量子实际上是关于在另一个维度上的应用数学。可能是生物学，因为生物学实际上是最接近人类大脑的东西，但我们不知道。我们甚至不了解自己的大脑，因此构建一个大脑需要很长时间。