李彦宏：人工智能将成为互联网下一幕的核心动力

2016-06-09 10:20:36

6月8日，第十一届百度联盟峰会在“风花雪月城”——云南大理举办。

历届峰会上，李彦宏都会与大家分享他对互联网行业的看法与思考。在今年会上，李彦宏首次使用PPT现场演示了百度的人工智能技术。他说：推动互联网下一幕发展的核心动力，不是大数据，不是云计算，而是人工智能。

移动互联面临巨大挑战：

日新月异的科技舞台上，第一幕是PC互联网时代，第二幕是移动互联网时代。

PC互联网经历了18年的增长周期，而移动互联网只用了大概4年就走到了现在。但是，移动互联网正面临巨大挑战，其初期发展主要得益于人口红利释放，但最近两年用户规模增速在明显下降，每个人都感受到其中巨大的压力。

下一幕：人工智能

互联网即将迎来发展的第三幕，而推动互联网第三幕发展的核心动力，不是大数据，不是云计算，而是人工智能。

现在，人工智能技术已经使百度语音识别准确率达到97%，目前百度每天的语音识别请求的PV超过1亿；现在，百度图像理解和问答系统，能实现用手机随便拍一张自然图片，系统不仅能回答图片中有什么颜色，还能实现更多轮交互；现在，百度无人驾驶汽车已经可以像正常车辆一样加速、并线、超车。3到5年内，无人驾驶一定可以成为现实。

人工智能毁灭人类？有生之年不会

人工智能到底会解放人类，还是毁灭人类？李彦宏说：“我是属于比较乐观的那一类，我认为人工智能会做的是解放人类，至少在我有生之年，它毁灭不了人类。”

人工智能可以解放人类的繁琐工作，激发无限的可能性。例如，现在百度教育贷款的处理速度已经可以用秒计算，而以前，普通的处理时间要以天计算。而这些技术，百度会无偿地开放出来，供伙伴使用。很快会开放深度学习的源代码，推动人工智能迅速地渗透到各行业，改变社会。

李彦宏：人工智能将成为互联网下一幕的核心动力

以下为李彦宏演讲全文+PPT：

欢迎大家来到第十一次的百度联盟峰会，在去年的时候我已经基本上预告了今年要讲什么。按照惯例我们在联盟峰会上会讲产业趋势，而今年我们稍微变了变形式，以前是纯粹“讲”，今天有一个PPT，它题目叫做《下一幕》。

李彦宏：人工智能将成为互联网下一幕的核心动力

去年在联盟峰会上我讲了互联网的第一幕和第二幕，我们先回顾一下。从1994年开始的PC互联网，一直持续到了大约2012年，应该说是改变了整个世界、改变了人们的生活，这算是互联网的第一幕；我觉得第二幕应该算是从2012年开始，每个人都切实地感受到了移动互联网的大潮对于我们生活的改变。所以我去年就留了一个疑问：移动互联网之后是什么？今天我想和大家分享这样一个主题。

从2012年到现在，其实只有短短四年的时间，移动互联网的成长非常迅速，同时我们每一个人可能也感受到了其中的压力。这个压力是什么？中国互联网的渗透率现在已经到了50%左右，如果把老人、小孩这些都去掉，其实能上网的人大多数都已经上网了。现在，人口的红利快要没有了，该用智能手机的人都已经用上了智能手机，市场的规模也逐步趋于饱和。现在大家都说市场很大、很繁荣，各种各样的机会不断的出来。可是当我们再往前看一下的时候，我们会发现整个互联网面临着巨大的挑战。PC互联网走了18年左右的路，移动互联网走了仅仅四年，很多人就已经感觉到这当中成长的压力。

过去的PC互联网时代，比如说百度成立的时候，中国只有不到1000万网民，现在这个数字是7亿，这里一直有人口红利的迅速增长。移动互联网仅仅发展了四年时间，就基本上已经处于一个普及的状态了。在这种情况下，未来会是什么样子？

互联网靠什么？

其实现在从国家政策的角度来讲，非常提倡所谓的“互联网+”行动计划，这是因为国家的经济进入了新常态，从国家政策的角度来讲，我理解新的增长动力就是希望靠“互联网+”，让互联网和每一个行业结合来提升运营的效率，从而推动经济持续地、高速地增长。但是国家靠互联网推动经济的增长，而移动互联网本身的增长我们现在已经看到瓶颈了。所以我们必须要思考互联网靠什么来保持它持续地、高速地增长。最近几年其实这两个词都是非常热的，一个是大数据，一个是云计算。所以互联网大的下一幕是不是大数据，是不是云计算？我的答案：不是。那是什么？是人工智能。

互联网进入第三幕

这是我本来去年就有点想讲的，后来因为要讲其他的内容，所以把它推到了今年。没有想到在过去一年当中人工智能从一个高精尖的科技变成了每一个人都可以街谈巷议的热门话题。事实上，人工智能背后的技术其实还是非常复杂的，需要投入、需要做的事情是非常多的。所以我想先给大家回顾一下人工智能的发展历程。

1950年图灵提出图灵测试，就是当你对面有一个屏幕和你交流的时候，你说一句话它回答一句话，看看回答这个话背后的究竟是一台机器还是一个人，如果你能够区别出来是机器还是人，就说明计算机还不具有智能，如果你区分不出来它是一个机器还是一个人，我们就可以说计算机具备了智能。

到1956年的夏天，MIT（麻省理工学院）一群科学家首次提出了“人工智能”这个词，Artificial intelligence。当时他们聚在一起的时候，六七个人打算用一夏天的时间，用他们这些聪明的头脑就可以解决人工智能的问题。没有想到不仅仅是一夏天解决不了，之后的半个世纪都没有能够解决人工智能的问题。我们看到70年代、80年代，一直到90年代初期，90年代是我在美国读计算机的时期，我们有人工智能的课程，我非常喜欢，但是学完了之后非常失望的发现人工智能其实没有实际的应用，在当时任何一个领域我们都看不到有价值的人工智能的应用，所以当时非常depress（失望）。

90年代以后，数据量越来越大，计算的能力也越来越强，机器学习逐渐兴起；到2006年一个叫做深度学习的模式首次能够证明它比过去所有的算法例如图像识别等都更加有效，而且是远远地超出过去图像识别的能力。深度学习其实也不是2006年提出来的，是很早就提出来了。但是2006年为什么出现了这样一个拐点，为什么大家突然觉得这个东西行了、work（起作用）了，是因为数据量越来越大，计算能力越来越强，而且越来越便宜，所以过去那些不实用的算法，到2006年以后逐步进入到了实用阶段。

这里还有一个2013年，在2013年年初，百度对外宣布成立IDL（深度学习研究院），开始大规模进入深度学习的领域。以上大致就是人工智能发展60年时间的回顾。

现在人工智能已经能够在多个领域显现出来它的威力，第一领域是语音的识别。当前百度的语音识别准确率超过了97%。目前语音识别日请求的量到了1亿以上。97%是什么概念？它比正常人的听力都要好一些了。不信我们来试一试。

百度语音识别技术

展示语音识别技术：播放方言或发音不清晰的语音，请现场嘉宾判断内容。在观众表示很难听清的情况下，机器则能够准确的进行判断

深度学习这样的计算机能力在语音识别上已经相当精准，所以我有时候向朋友推荐用百度语音搜索，很多人第一反应是百度有语音搜索吗？第二反应是它能够识别我的话吗？我的话不是很标准，其实大家看到了刚刚这些不是很标准的语言都可以被很不错地识别出来了。不仅是语音方面的进展，我们可以看到在语音合成上也能做很多事情。刚才是识别，你说了它能够知道你说什么，接下来它能够学你说话，说出来跟你说话几乎是一模一样的。我给大家演示一下，模仿麦兜动画片里面的配音演员对百度联盟峰会说一段话。

展示语音合成技术：通过人工合成用麦兜的声音说出一段话

展示语音合成技术：通过人工合成用麦兜的声音说出一段话

这个配音演员其实从来没有说过这些话，但是我们根据过去他说的很多很多话就可以人工合成出来一段他“讲”的话，并且听起来还是很像的，合成的准确度也会逐步地提高。

这是语音的合成，其实我们完全可以想象图像也可以合成，图像合成有什么实际用处呢？昨天晚上吃饭的时候大家聊，如果一旦实现了图像的合成，以后演员、大腕们演电影也将会被改变，只要他们同意演这个电影，不用实际去演，我们可以把他所有的动作和语言合成出来。过去一个大腕一年拍两部戏、三部戏，以后可以拍2000部戏、3000部戏，只要他同意我们就可以合成出来各种各样的动作和声音。所以这些技术一旦应用到各个领域，就能够产生出来无穷无尽的可能性。

下面我们看一下图像识别技术，先看2015年时做到的东西，这个我在当时联想的技术创新大会上演示过一遍，大家看一下。

展示2015年图像识别技术：对既有图片进行提问

图像识别技术

大家看到这个图片是在表达什么样的东西，计算机是能够明白的。不仅如此，它还能够懂得你问话的意思，它能够理解你的自然语言。这是2015年我们已经实现的，那接下来我们看一下2016年和2015年有什么不一样？

展示2016年图像识别技术：对现场拍照得到的图片进行提问

2016年图像识别技术：对现场拍照得到的图片进行提问

2016年和2015年有什么不一样？2015年我们用了一张静态高质量的图片，2016年我们就用手机随便拍一张很自然图片，在质量不是很高的情况下机器仍然理解的比较到位，画面里是什么样的东西，我们的提问是什么意思。所以对图像和对自然语言理解的相关技术也在迅速的提升。

其实我们人工智能的技术不仅仅在图像识别、语音识别、自然语言理解方面有非常大的推动作用，另外一个很大的推动作用实际上是百度从去年开始对外宣传的无人车。我一直在说，从本质上来讲无人车是带着轮子的电脑，这台电脑就可以像人一样，识别障碍物、识别交通灯、遵守交通规则、带着乘客到任何他想要去的地方。这里我也想给大家放一个短片，演示一下我们的无人车实际在路上跑的情况。

无人驾驶汽车

播放“无人车”上路测试视频

百度无人驾驶汽车

大家可以看到，视频中无人驾驶车路测的整个过程是没有人进行任何干预的。当然，无人车离使用还有一段时间。现在我们能做到的是在路况不是特别复杂、非上下班高峰期的时候，无人车不需要人工干预就可以上上下下、做各种动作，但如果路况特别复杂的话，现在我们技术还达不到。但是我们相信，三五年之内，无人驾驶一定可以成为现实。

我们认为人工智能再往下发展，其最主要的作用是会取代简单的脑力劳动。我刚才举的几个例子，比如无人车，一般人用几个月都可以学会驾车，而自动驾驶就是能够模仿人类的这种简单脑力劳动。还有一些在餐馆里的点餐员，他做的事情也是相对比较简单的，我们的人工智能也能够替代这样的功能，我们来看一下点餐的状况。

播放“度秘”入驻上海肯德基餐厅为顾客点餐视频

播放“度秘”入驻上海肯德基餐厅为顾客点餐视频

这是在上海的一个肯德基概念店，我们用度秘实现了点餐的功能。其实我们可以想象，未来很多这种简单、重复性的劳动都可以通过人工智能的方式来实现，代替人的作用。

人工智能重构传统产业

当然，人工智能在很多领域都有应用，比如金融领域。依据大数据，依据我们对一个人的理解和分析，这其实也是一种人工智能、机器学习的技术，能够实现很多过去不那么方便实现的东西。比如征信，现在百度的教育贷款，基本上就是以秒为单位就可以决定是否要给一个人贷款，而在过去恐怕是要以天为单位去计时的。

在很多领域，人工智能都能够对传统产业产生改变。我觉得不需要我做更多的解释，大家只要想一想刚才展示的这些技术，无论是语音识别也好，自然语言的理解也好，还是图像识别也好，这些技术一旦应用到各种各样的产业中，都会对每一个产业产生巨大的改变。我们讲了很多年互联网对于制造业的影响，讲了很多年的物联网，我可以下这样的结论，如果没有人工智能的能力，物联网也好，互联网也好，对于制造业——大家知道中国是一个制造业大国——是不会有本质性影响的；但是有了人工智能，它对于制造业几乎每一个领域都可以产生巨大的影响。原来大家觉得一个死的东西，将来就变活了，它就会具有人类的智能。

人工智能是解放人类，还是毁灭人类？

那么问题来了，这可能是很多人比较喜欢谈论的一个话题：人工智能到底是会解放人类，还是会毁灭人类？业界其实有很多大咖都倾向于后者，他们都很担心人工智能会毁灭人类，我是属于比较乐观的那一类，我认为人工智能会做的是解放人类，至少在我有生之年，它毁灭不了人类。

其实这个道理很简单，大家想想，能够毁灭人类的东西早就出现了，比如说原子弹。现在人类拥有的原子弹可以毁灭人类很多次，但是为什么至今还没有能够毁灭人类呢？这是因为我们还拥有最终的控制权，谁能去push那个launch button（发射按钮），这个方面还是有很好的机制能够管理的。所以人工智能会越来越智能、越来越接近人类的能力，能够解放人类很多繁琐的工作，也能够激发无限的可能性。过去我们觉得不能做的事情，未来可能通过人和机器的结合，就越来越能做了，但是我不觉得人工智能会毁灭人类，因为我们有能力去控制，我们也有能力去制定相应的规则。

讲了很多技术，我想说的是，这些技术不仅仅是属于百度的，我们会无偿把它开放出来，供我们联盟的伙伴使用。不管你想做什么行业，不管你想进入哪一个领域，百度这些技术完全都是开放的，让大家自由地使用，甚至我们很快也会把我们深度学习的源代码开放出来，让大家看到底这些东西是怎么实现的，大家甚至可以在这个基础上进行相应的改进。这样的话确实能够使得人工智能迅速地渗透到各个行业，从而改变我们的社会。

下一幕就是人工智能