腾讯姚星:算法将成为人工智能时代的“科技原力”

2016-10-26 19:34:29

“TEDx漕河泾——科技的原力”主题演讲25日在上海举行,腾讯公司副总裁姚星回顾了中国互联网20年经历的三个阶段,并且展望了人工智能行业的发展趋势。他的观点是——算法,将成为人工智能时代的“科技原力”。

过往20年,是互联网飞速发展,并渗透到我们经济生活的每一个方面的20年。姚星将其划分为三个阶段:窄带时代、宽带时代和移动互联网时代。诞生于1998年的腾讯,今年的11月11日将迎来18岁生日。从QQ到QQ空间,再到微信,腾讯在互联网发展经历的窄带、宽带和移动三个阶段,均有最具代表性的产品推出,而支撑产品创新的,一直都是技术原力的驱动。

今年正是1956年Dartmouth会议上提出“人工智能”概念的60周年。姚星认为,人工智能可能会是接下来技术爆发的一个重要领域:“人工智能在过往60年中起起落落,而随着云计算和大数据发展,人工智能将会散发出璀璨光芒”。

当前的人工智能行业,在语音识别、图像识别等垂直领域已获得了一些阶段性进展,诞生了一些不错的应用。不过总体来说,人工智能发展还处于一个比较初级的阶段。一个明显例子就是,人对新生事物的认知只需要通过少量样本的学习就可以掌握,但目前机器学习还是基于大量样本的。

“人工智能的科技原力就在于算法的突破”,姚星说,机器学习的方法在于学习深层次特征,而不是表面现象。这就像人类学习鸟儿飞翔,不是仿照鸟一样粘上羽毛、插上翅膀,而是研究空气动力学和流体力学。

他认为,人工智能核心算法的突破将会在三个方向:创造力、归纳总结能力和举一反三能力。腾讯的人工智能实验室致力于对“通用人工智能”的研究,提供更加便捷的智能工具,帮助每个人实现心目中的“大白”,让青少年被理解、成年人被保护、老年人被照顾。

腾讯姚星:算法将成为人工智能时代的“科技原力”

以下为姚星演讲全文:

刚刚听到C++之父本贾尼的演讲让我思绪万千,作为C++的忠实粉丝和使用者,让我想到我用C++写代码的青葱年华和激情燃烧的岁月。感谢本贾尼先生发明伟大的C++语言,改变了我这一代人的工作方式。

大家好,我叫姚星,来自腾讯,在腾讯工作了12年。一个多月前集团公关部的同事告诉我,希望我可以参加TEDx,讲述一下腾讯背后的科技原力,我当时说我不知道讲什么,因为我们做的事情都很普通也很平凡。同事说这样不行,他一方面告诉我TEDx是一个很重要的presentation,另外一方面也告诉我腾讯作为一个世界级的互联网公司过往做了很多世界级的产品,但在对外的技术宣传上少之又少,我们有责任通整个行业进行我们技术上的经验和教训的交流。我一想也是,仔细想来,虽然我们的工作很平凡也很普通,但是平凡中会折射出与众不同,今天我就和大家分享一下腾讯认知的"科技的原力"。

原力是什么?按照《星球大战》电影的定义原力是"一种极大的能量"。

首先看一组数据:10000亿,100亿,4小时。10000亿是如今全球IM一天的消息总量,这是个极大的数字,如果我们把它换算成书籍的容量,它大概是1亿册,相当于中国最大的图书馆——中国国家图书馆藏书量的5倍;100亿是当今全球一天的图片分享总量,这个数字如果用数码相机一秒钟拍一种照片的速度衡量,它需要用300年才能产生100亿的照片,如果我们把这些照片连接起来,它可以绕地球50圈;4小时是现在我们平均每天上网的时长,这个时间已经超过了我们观看电视的时间。

这些数字的背后也是信息产业的3个时代,过往的20年是信息时代快速发展的20年,信息产业的发展已经超过了其他产业,它经历了3个时代:分别是窄带时代、宽带时代和移动互联网时代。

窄带时代,我们的网络传输效率比较低,主要解决的是沟通问题,人们无需再像古人那样"飞鸽传书"或者通过传统的邮件进行通信。人们可以通过internet实时的传输我们的消息,我们可以结交更广阔的朋友,无论身处天涯海角,只要能连接上internet,信息总是可以触手可及。随着基础网络设施的发展,网络传输的效率和容量越来越大,我们进入了宽带时代,在宽带时代人的诉求不再仅仅是沟通,更大的诉求是信息分享,"人人为我,我为人人",人们在朋友之间分享快乐,总结教训;人们在更广阔的互联网世界里帮助他人,或者寻求帮助;人们在熟悉的、不熟悉的,认识的、不认识的人之间传递信息,分享信息。随着3G/4G移动通信网络的发展,智能手机的普及,我们又进入到了移动互联网时代,移动互联网时代人们不再像原来那样要在指定地点,特定时间段连接信息世界,人们可以每时每刻、随时随地连接互联网世界。

信息时代的发展推动了整个互联网产业的发展,也提升了我们的生活质量和水平,每个阶段都诞生了极具有代表性的互联网产品,它们的出现改变了人们的生活方式,也深深的影响了我们这代人的生活。

QQ就是窄带时代极具代表性的产品。大家还记得那个网络传输效率较低的年代google的首页吗?google的首页为何如此简洁?google的诞生是1998年,也是身处窄带时代,如果看它的首页字节,大小是小于1024的,为什么要小于1024字节,因为以太网的MTU(也就是以太网最大传输单元)是1024,google为了让用户在一个网络包中传输完成,所以它把页面大小降到了1024以下,这是一种极致传输的表现。QQ的背后也蕴藏着诸多极致追求,早期的QQ客户端安装包是几十k的大小,是为了让用户更快下载,更方便使用。QQ后台的通讯协议是修改过TCP协议站的,之所以这样是因为QQ希望传输协议既具备TCP的丢包重传能力,又要具备UDP的高性能,这样QQ可以在保证传输信息的同时又可以维护更多的用户网络连接,在那个年代QQ的单位后台处理能力可能是其他同类产品的10倍以上。

QZone是宽带时代的杰出代表产品。2013年Facebook的公开数据显示Facebook的日上传照片数为3.5亿张,总照片存储数达2500亿。今天的QZone日上传照片峰值超过5亿,照片总量达6000亿,和Facebook同一级别!照片的存储是宽带时代极具挑战的技术难题,它不光是海量存储的问题,而且还有海量访问的问题,因为你的照片不仅仅是你自己访问,你的朋友也会来访问,它带来的性能开销是几十上百倍的。存储的难题除了性能还有成本,极致性能下的极致成本。QZone的后台存储系统是一个在物质介质上重新实现的一套存储系统,它是一个非常有挑战的技术,它对文件系统的inode索引进行重新设计,使得存储系统既能充分的使用磁盘空间,又能很好的管理照片这样的"小文件"。QZone后台存储系统迄今为止在整个后台里面也是领先的。

微信是移动互联网时代的超级APP,它不仅是一款IM,也是一款SNS平台,同时能进行内容分发,还是智慧城市的入口;它不仅能发消息、分享朋友圈,它还能打车、吃饭买单、购物、交水电费,甚至预约看病挂号。超级APP肩负着超级责任,有数据显示,Amazon的AWS服务宕机持续时间超过40s,上面的服务像Slack、Netfilx、Pinterest等多款APP会出现无法响应等问题。大家还记得去年的天津滨海新区的爆炸吗?在爆炸的中心区域就有我们Wechat的数据中心,那次的事故为什么没有影响到Wechat的稳定运营?因为很快我们把Wechat的服务切到上海、深圳的数据中心去了。因为我们深知Wechat的每次闪断不仅仅是一条消息的延迟到达,不再是查看朋友圈时的缓慢,更重要的是你吃晚饭后结账时的困境,也可能是明天无法及时看病的苦恼。Wechat的后端采用了全球分布、用户就近接入的架构,在数据的一致性,网络的可靠性做出了极多的容错、容灾设计,这种极致架构不仅能应对人祸,还能应对天灾。

信息时代的科技原力是"摩尔定律",摩尔定律提升了基础网络建设的进程,让我们的互联网产品能快速更新。

2016年是AI起源的Dartmouth会议60周年,人工智能在过往的60年发展中几经沉浮,起起落落,在今年散发出璀璨的光芒。人工智能的兴起是大数据、云计算科学进步的产物,也是人类对未来世界向往的必然。

什么是AI?AI是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。AI包括:计算机视觉、语音识别、自然语音处理等类似人类的感知、认知智能。

当下很多人认为AI就是机器学习,或者说是深度学习,这是很狭义的,机器学习是AI的核心算法,确切的说AI和机器学习的关系是这样的:AI = A->f(x)->B,机器学习是人类智能行为的一种拟合函数。

目前的AI总体来讲还是一个非常初级的阶段,虽然我们在某些"感知"智能上有些突破,比如我们在计算机视觉上的人脸识别能力,语音识别上的速记能力等垂直领域已经接近或者超过人的平均智能水平,但是这些相对于一个人的综合智能来讲都还是一个非常狭窄的。之所以这样,本质上来讲,我觉得还是算法本身还需要更高维的突破,而不是简单的演进。比如我们针对视觉的AlexNet到VGG再到现在的ResNet,每次算法的演进还只是停留在更深的神经网络、更复杂的神经网络连接的设计上,通过这样复杂的神经网络学习、更多的样本特征来更好的拟合人脑的"感知",再比如"认知"智能的自然语言处理,但是面对这种语言序列问题,尽管我们的神经网络从早期的RNN演进到LSTM,再到现在的Attention Model,但至今为止机器还无法完全胜任这种复杂计算。

人的智能是一个非常高的起点,人是经过数十亿年的生物进化,即便是新生儿,从他一出生开始他的智能起点就非常高,比如出生不久人就知道这个时间是3维的,如果我们把东西藏在某个大型物体后面,人的本能就能知道。这是一个非常高的智能起点。人认识新生物也只需要少量样本就能学会,但目前的机器学习并不能做到这样,我们无论设计多么领先的神经网络模型,都需要重新训练数据样本,并且需要大量数据训练样本的训练拟合。但目前的本身的机器学习方法我认为是正确的,因为我们学习的不在是表面现象而是深层次的特征。这就犹如人类学习鸟儿飞翔不是仿照鸟一样粘上羽毛,来振翅飞翔一样,本质上的飞翔原理是空气动力学和流体动力学。

AI的核心算法如何突破?如果类比人,我想需要在3个方面进行突破。1、创造力;2、归纳总结能力;3、举一反三能力;如果它们对应到机器学习就是"强化学习"、"无监督机器学习"以及"迁移机器学习"。"强化学习"已经通过deepmind在Atari和alphago上证明了巨大成功,alphago之所以厉害,是因为通过强化学习自对弈产生了大量的非人类棋局样本,通过这些样本再来进一步学习提高,未来我们需要采用"强化学习"创造更多的数据。"无监督机器学习"至今为止没有好的"聚类"算法,也就是归纳总结能力。人类能给表面非因果关系总结出很多原理,如"三点确定一个平面","惯性定律"等,这是一个很强的高维抽象能力,未来的无监督机器学习需要在这上面进行突破,通过少量的样本,站在前人基础上的归纳总结。"举一反三"也是人的一个重要的基本能力,通过学习了"下围棋",快速的推演到"下象棋",这需要"迁移机器学习"在模型迁移上的突破。

信息时代的科技原力是摩尔定律,AI时代的科技原力是"算法",而且这种算法是有如人类进化一样,从"单细胞"到"多细胞",再到"智能"的演进过程。

AI的未来是什么?我想AI的未来不仅仅是给我们提供更加安全、更加高效、更加便捷的智能工具,而是要帮助我们实现每个人心中的那个"大白",那个超级英雄,使得我们的小朋友更加的"被理解",他们不会由于父母的不在身边而缺少陪伴;使得我们的成年人更加的"被保护",他们不会由于危险的工作而使得自身安全得不到保障;使得我们的老年人更加的"被照顾",他们不会由于在偏远山区而得不到及时的治疗。无所不在是AI的未来。

从18世纪的第一次工业革命开始,人类的每次进步都源于科技的进步。而当今的互联网时代,从窄带到宽带,从移动互联网,再到当下的AI无不是一浪又一浪的科技变革,这种科技的进步也犹如潮汐一样一次次越来越猛烈的推动着我们进步。

我有时会问自己:是什么样的力量在推动着人类对未知领域的探索和渴望,是什么样的力量在推动着科技的进步?我想答案是"科技的原力","原力"是什么?原力就是我们改变世界的力量,原力就是每个人心中的追寻"自我主宰"梦想,原力就是人们仰望星空的感觉。而我们要做的就是在这"创造原力"的同时,保持这份"原力"的真正含义!may the force be with you!原力与你同在。谢谢大家!


收藏 举报

延伸 · 阅读