李彦宏讲述在大数据发挥价值过程中“洞见”所占据的地位

2016-05-30 20:32:39

为什么听过了那么多科普,依然玩不转大数据?

5月25日的2016中国大数据产业峰会上,李彦宏为在场的嘉宾讲了一堂“大数据进阶课”。在“课堂”上,他以“日心说”为例子,讲述了在大数据发挥价值的过程中,“洞见”所占据的不可或缺的地位。

李彦宏的大数据“进阶课”:加一点洞见,让大数据价值爆棚

近500年前,哥白尼根据推理提出了“日心说”,然而因为缺少数据支持而难以说服别人。而后,一位丹麦科学家收集了大量天体运行数据,但遗憾的是并没有从中发现规律,对于解释“日心说”来说依旧意义不大;直到那一天,机智的开普勒对这些数据进行了深入的分析和思索,从中发现了行星绕太阳的轨道是椭圆形,成功解释了过去解释不了的现象,这才让公众相信了“日心说”。

开普勒从这二十年的天文数据中挖掘到的,就是李彦宏所说的“洞见”。

缺乏洞见的大数据,就像没有子弹的枪

日心说的确立过程是一个从理论到证明的过程。

哥白尼在《天体运行论》开篇便说:“不懂几何者禁止入内”。之所以这么说,是因为数学和逻辑是他的“日心说”最大的支撑。虽然他也观测天体运行,但更多是对逻辑的检验,这些观测能证明“地心说”的错误,却不足以论证“日心说”的可信。后来布鲁诺、伽利略接受并传播日心说,也都是基于数学逻辑,没有得到广泛认可,支持日心说的布鲁诺甚至因与宗教的冲突死于火刑。

哥白尼之后,另一个对“日心说”做出重要贡献的人是第谷·布拉赫。他是望远镜发明前最后一位伟大的天文学家,也是世界上前所未有的最仔细、最准确的观察家,他通过20多年的观测获取了大量天文数据,但并没有找到数据间的规律,也没有做出好的解释。

当时的观测条件与今天当然不能同日而语,因此第谷作为大量数据的收集者,为“日心说”的证明乃至整个天文学,都做出了不可磨灭的贡献。后来,第谷的助手开普勒对他多年观察记录的天文数据进行了详细的数学分析,他先仔细研究第谷留下的行星位置资料,在分析历年的火星公转数据时发现,哥白尼假设与第谷数据不完全吻合。经过6年的大量计算,开普勒认为唯有行星轨道是椭圆形才能解释一切。1609年之后,他相继提出开普勒三大定律,即轨道定律、面积定律和周期定律,对“日心说”进行了改进,由此终于完美解释了天体运行方式,甚至得到“天空立法者”的美称。这里的“法”,便是他从大数据中获得的洞见。

约翰尼斯·开普勒

在“日心说”的发展中,哥白尼的巨大贡献在于突破性的思考、严谨的数学考证,更像是一种天才式的观念,而非从数据中获得的结论;相比之下,开普勒的成就更值得我们现代人借鉴,他基于海量的数据,找到可信的规律,这才叫“洞见”。

假如大数据是枪,那么“洞见”就是子弹,二者缺一不可,没有子弹的枪是毫无杀伤力的资源空置而已。今天,获得准确数据不再像哥白尼或第谷的时代那么困难,不管是传统行业还是互联网公司,都存储着大量各种各样的数据。但现在缺乏的,不是数据,而是“洞见”。没有“洞见”的数据,再多也只是负担,是“哑巴数据”,虽然看起来规模壮观,大多数人却只能望洋兴叹,没法从中做出伟大的创造。

从大数据中找到insight,释放数据中不为人知的一个又一个“日心说”,让数据的价值爆发出来,造福于人,是李彦宏对大数据时代的基本期望。

不过,挖掘到大数据中的“洞见”之后,百度真正的野心在于人工智能。

如同日心说一样,人工智能替代人类的想象和概念很早就存在于小说、电影之中。李彦宏说他在美国读书的时候特别喜欢人工智能的课程,但是学完之后发现外界没人认可,因为当时的人工智能在工业界是没有实际应用的。这非常像哥白尼提出日心说之后的情形。

而在人类进入信息时代之后,获取了各种各样的大数据,政府的信息化建设采集了海量数据,百度搜索引擎采集到了海量数据,各种设备、各种传感器采集到了海量数据。李彦宏认为,这些大数据就如同当年丹麦天文学家第谷·布拉赫所做的观测一样,为人工智能从理想到现实提供了基础。事实上,我们已经站在人工智能未来的大门之前,要做的只是推开这扇门。

实现梦想中的人工智能,推开这扇未来之门则需要“洞见”。

强大的人工智能需要“大数据+洞见”

日心说确立的基础是第谷采集到的天体运行数据,而开普勒“洞见”到了数据背后的规律。如今,人工智能也正在这个突破点上。人们已经发展出来模拟人脑的大型神经网络系统。在摩尔定律的进化下,人类已经有了前所未有的计算能力。

同时,人工智能还发展出来深度学习算法,通过各种算法,可以在大数据中不断学习人类的智能与行为,完成人类的工作。人工智能技术水平会越来越高,运算能力会越来越强,现代社会中所产生的大数据也会越来越多。当这一切结合起来,改变人类未来的人工智能就会产生。

利用大数据资源发展出人类所梦想的、能够替代人类体力劳动与简单脑力劳动的人工智能,就是李彦宏的“洞见”。

百度早已在做了。百度无人驾驶汽车项目每天要处理十多个T的数据,并与芜湖合作,建立无人驾驶车实验区,通过不断实验来获取路面交通的真实数据;度秘也已进驻KFC,通过与人类的对话点餐来不断学习,提升人工智能水平。

正如李彦宏在讲演中所说:过去我们认为只有人能够实现的事情,未来越来越多的情况下机器可以实现了。如果说工业化是把人从体力劳动当中解放出来,人工智能很可能会把人从简单的脑力劳动当中解放出来。


收藏 举报

延伸 · 阅读