语音助手 Siri 的联合创始人、现任三星战略与创新中心首席技术官兼高级副总裁 Luc Julia 解释了为什么人机交互引起了他的兴趣,讨论了 Siri 后端是如何在 Apple 构建以及分享他对人工智能未来的愿景。
玩个人电脑
所以,当我还是个孩子的时候,最先开始玩电子产品,然后在大约 15 岁的时候电脑出现了。我开始玩电脑——当时的第一台电脑,个人电脑——PC。而且你知道,我开始后也再没有停止。当时只有 BASIC 语言可用,但我用的是汇编语言,用它编程。
人机交互
后来有趣的发现,计算机是否可以与人类对话,或者人类是否可以与计算机对话。所以我当时做了所谓的HCI——人机交互。比如做一些信号处理,因为当你想让电脑和你说话的时候,你需要让电脑去抓,抓取信号理解信号。
语音识别和手势识别以及一切识别都是我的专长。然后,它后来变成了人工智能,因为当你开始理解信号时,这就是人工智能。
我在法国攻读博士学位,后来在麻省理工学院和斯坦福大学做博士后。实验室里的一些人决定是时候创建一家公司,因为技术看起来已经足够好了。所以 SRI [斯坦福研究所] 是一个衍生工厂!
我后来开始研究所谓的多模态,它基本上是试图将所有模态放在一起,以便为计算机创建消息。语音是最简单的一种,因为当时在计算机中安装麦克风比摄像头更容易。
但这些并不意味着识别语音很容易,因为即使在今天,语音识别也很棘手——不是对单词的识别,而是对意义的识别,这就是所谓的“自然语言”。
互联网作为游乐场
在 SRI,我们进行了一些应用研究,比团队中的其他任何人都更实用。我们推出了 CHIC [计算机人机交互中心]——它是一个应用实验室,我们在那里创造了一堆产品。
在 2000 年,1999 年,我认为它已经足够好了,现在可以进入现实世界来创造开始。
1999 年那是互联网的早期时期,用真人测试产品更容易,因为你只需要把它放到互联网上让人们和机器一起玩。
Siri的诞生
回到 1997 年,那是互联网的开端。是的——全球互联网,对吧?
所以它开始发展起来了,当时还没有谷歌,真的没有办法在互联网上找到东西。我们认为看看你是否可以使用语音找到一些东西是个好主意。这就是个人助手的想法——它帮助我们找到正确的信息。
我花了很长时间研究——直到 2007 年,该产品才准备就绪,当时 Adam Cheyer 创建了它的公司 Siri。他们围绕这个语音助手创建了一个产品。iPhone 也是在 2007 年推出的,所以很自然地用它说话,因为这部新手机里有一个很好的麦克风,
为 Siri 构建后端
Cheyer 找我回来,意思是我们共同培育自己的孩子。
后来这家公司的 Siri 拥有大约 150,000 名用户——150,000 名用户!
我的意思是,你基本上可以用家用服务器做到这一点,所以没关系。后来开始与 Apple 合作,我们知道将拥有 3 亿用户——比 15 万用户显示要困难一些。
因此,挑战在于确保系统具有可用性可可扩展性,并且我们能够提供必要的性能。因为当用户拥有语音识别器时,还需要能够始终为TA提供良好的响应时间。
我有机会负责 Siri 方面的一切——一切的价值。当然我们只看到接口部分,语音接口,但是服务器是很多的,后端也很多。
这是一个非常复杂的系统,有一个庞大的后端。iTunes 基本上“只是”存储,我们也需要大量的计算能力来运行 Siri。我们从头开始构建完整的后端。
从物理构建它——购买服务器,购买实际的数据中心本身——意味着到处都是挑战。看看 Siri,它有大约 17 项服务。当用户查看 Apple 的 Siri 时,它有大约有 5 项服务,当然我们希望添加越来越多的服务。
在惠普引入敏捷开发方法
当我去 HP [Hewlett-Packard] 时,大公司的资源是丰富的。第一天,他们给了我 250 人,250 名工程师,这大约是我过去的 10 倍。
所以它的管理是和初创公司不同的。再说一遍,这是在 2010 年,10 年前的 2010 年,一家大公司里我们所说的敏捷方法是不存在,它使用的就是瀑布方法研发,这意味着您提前六个月的计划——这是很多人不希望在现代软件中发生的事情。
我在那里向高层介绍的东西之一就是敏捷,所以有 250 人不习惯它是一个挑战,但这是一个非常有趣的挑战。我们还开发了一款与惠普不同的新产品。惠普非常擅长打印机之类的,但它不知道连接的打印机可能是什么。因此,我们创建了现在称为 ePrint 的第一台联网打印机,第一年我们实际上售出了大约 8000 万台。
在巴黎开设三星人工智能实验室
今天有一个叫 SmartThings 的东西,三星几年前收购的,它也有后端。
后端基本上是允许存在云的东西——即物联网云。物联网云允许用户连接三星设备以及一些其它非三星设备。这是一个非常异构的环境,所以需要确保所有设备都可以相互通信。我们为此工作了 5 年。
另外,我想在巴黎这里开个分布,于是我们在 2018 年 6 月开设了三星的 AI 实验室。我相信法国工程师品质非常好。
法国有很多初创企业,尤其是现在的巴黎。当我还是学生的时候,放学后工程师们都直接为大公司工作。
我最近听说那些工程学院的 60% 学生现在想创业或为初创公司工作。所以有一个更加动态的环境,这也意味着这些人会看到一些东西——他们愿意,我不会说更有能力,但他们会接触到更多的东西。所以他们在我们提出的项目方面会更加灵活,这就是我喜欢法国工程师的原因。
人工智能的生态成本
AI 其实也很容易,因为你可以在一堆 CPU 和 GPU 或任何 PU 上扔去大量数据,你就可以得到一些结果。
你可以尝试,你可能失败,然后再试一次,实际上你会使用大量资源,特别是在存储方面,你正在使用的数据,还是在计算能力方面,因为你会进行不同的试验。
我注意到很多并没有真正关注,还有那些 CPU 和内存资源,它们在数据中心是看不见的,你自己感觉不到它们。我的意思是,有时候当你身边有自己的电脑时,你会意识到它们确实在工作,它们创造了一种温暖的环境,所以你会意识到它们。
但是当你使用 AWS 或 Microsoft Azure 或其他任何云时,你不会注意到这一点。
所以我说AI太容易了,而且你没有意识到你实际使用了多少能量来帮你正在做的事情,所以在某些时候,你需要——我们需要——清醒过来。
这就是为什么我总是试图解释需要非常小心,我希望人们会变得更加小心。我坦率地说,因为越来越多地鼓励我们使用这些资源,但需要实施一些法律法规。
人工智能的未来
早在 90 年代,我们谈论的第一个助手是语音助手,但现在我们将得到一个全能助手。
这将是一堆助手,因为不会是一个通用的人工智能。我不相信这会发生,现在只是按照今天的方式使用数学,而每个领域都会产生一堆助手。
所以我们将看到医疗领域的助理,我们将看到交通领域的助理。我们将到处看到人工智能。比如在医学领域——你知道 DNA 是非常非常有趣的东西。所以我们将看到 DNA 被解码,它可以用来通过机器学习帮助修复问题,通过深度学习,通过很多数据。这是很多有趣的统计数据。所以当然所有领域都会看到越来越多的AI助手。
有些人正在考虑其他事情——比如正在考虑用量子计算来做物理学。
而我们正在考虑用生物计算来做生物学。
所以现实情况是,这些事情仍处于早期阶段。量子计算也许不那么早,但它仍然非常非常年轻。而使用生物学计算,我们将无处可去。
如果我们相信,有朝一日,我们将创造出与人类自己的智力相近的东西,那就是某些人所说的一般智力,它不会通过数学来实现。
我不认为它会与物理有关,因为量子实际上是关于在另一个维度上的应用数学。可能是生物学,因为生物学实际上是最接近人类大脑的东西,但我们不知道。我们甚至不了解自己的大脑,因此构建一个大脑需要很长时间。
作者:场长
本文为 @ 万能的大雄 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。