百度大脑的自然语言理解的能力
9月1日上午消息,百度2016年世界大会今日举行,本次百度世界大会以“人工智能”为主题,百度公司创始人、董事长兼CEO李彦宏围绕人工智能发表了主题演讲。李彦宏重点介绍了百度大脑的四个功能:一个是语音的能力,一个是图像的能力,一个是自然语言理解的能力,还有一个就是用户画像的能力。
自然语言处理方面,主要应用是度秘。核心是通过机器人对于人的语言的理解,用人的语言来实现人机交互。李彦宏称,在最近的奥运会比赛中,度秘实现了对于篮球比赛的解说。实际上,除了运动解说,百度还将度秘应用在了肯德基点餐等方面,目前已在上海开设了概念店。除了语言理解,百度还在机器翻译方面应用了自然语言处理方面,目前可以直接翻译27种语言。
自然语言处理其实我刚才也讲了,它的成熟程度应该不如语音,甚至不如图像识别,但是即使在目前的状态下,它也能够给大家带来很多很多不一样的体验。最直接的例子应该是我们去年在百度世界大会上讲的一个例子,就是度秘。度秘是一个个人智能的助理。这个个人智能助理今天我们可以在手机百度里面找到,度秘跟用户进行交互,现在已经有超过一半的交互是通过语音和图像来完成的,去年我们也讲了,语音和图像将来会变成一个主流。
度秘除了它能够识别语音和图像之外,其实它更关键、更核心的技术,是能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,尽管不是每一次都能理解。
过去这段时间我们也利用度秘的自然语言的能力做了一个比较有意思的应用,用度秘来解说奥运篮球,下面我们看一下视频。
这个不是度秘单独完成的一次解说,是他和著名篮球评论员杨毅先生一起合作做的一次奥运篮球比赛的解说。今天我们也很高兴把杨毅先生请到了现场,现在请他上台。
杨毅:大家上午好,我是杨毅。
Robin:刚才我们看到很有意思。你跟度秘一起解说了一场篮球的比赛,而且我也注意到你的风格和度秘的风格还是很不一样的,我想问你一下,作为一个篮球评论员,你觉得一个好的解说员应该具备什么样的能力?
杨毅:首先我觉得很难说我有资格来讲一个好的评论员要具备什么样的能力,我相信很多行业都在不断地前进和发展。而且对一个解说员,即使他解说了一万场比赛,但他下面面临的一场比赛也是新的。但我想,总的来说,一个解说要想很好地工作,首先你要对这个项目有非常深刻的了解,无论对它的项目特点还是历史背景,第二个要有非常快速的现场反应能力,第三个我觉得要有出众的语言表达能力,把你看到的、听到的,能够尽快地呈现给观众或者是听众。
Robin:对,这些能力度秘都在不断地学习过程中,还有很多不完美的地方,我也希望度秘能够从你的身上学到很多很多东西。刚才我们看到你和度秘合作的这样一次解说,它跟你学习了一次之后,我们想让它单独做一次篮球比赛的解说,现在我们看一下度秘解说篮球奥运决赛的情况。
Robin:ok,这是度秘单独的解说,也想请杨毅先生评论一下你的学生表现怎么样?
杨毅:显然度秘比之前和它一起说的时候完成得更好了。其实我跟它说的时候,它的表现就是出乎我的预料的,我也听说它学习过上百场甚至上千场的比赛,它对比赛的基本知识储备是没问题的,在这个行业里面,它可能比我知道得还多,因为几年前的比赛我可能已经忘了,但是仍然装在它的电脑里。上知天文,下知地理,什么都明白,它的表达也是比较清楚的,在我跟它说的时候,我觉得只有一个小小的问题,我觉得它说话的速度确实是好慢。但是大家刚才看到,它说决赛的时候能明显感到语速加快了,更符合体育竞技的特点,更快速地将现场的情绪传达给观众。
Robin:对,我其实非常同意。刚才听的时候我也有点着急,它说的语速是比较慢的。但是像你刚才讲的,度秘也有它的优势,比如它的记忆能力是比人强的,它学习了几百场的奥运篮球比赛,每个运动员的个人资料它都记得非常清楚,遇到这些知识型的问题,它可以非常迅速地、方便地回答。另外我们看解说本身,用户是可以跟度秘进行互动的,你点一下“双方三分球的对比”,马上就出来各种各样的数据了,这是度秘的优势。但是度秘的劣势就是它对人的语言的理解和人的语言的创造能力还有很多需要学习的地方,我们也非常希望杨毅先生能够多给我们度秘提一些建议和提升的地方,也希望我们下次再有机会合作时,它说话至少快一点。
杨毅:我觉得它下面的这些功能是非常好的。你可以想象一下,如果它成为一个成熟的产品,在每个球迷收看比赛的时候在家里身边沙发上都能摆一个小机器人,一边看着电视里的比赛,听着电视里的解说,当然它可能在电视里解说;同时他身边也有个度秘,可以不断地就他所关心的问题问身边这个小机器人,能够随时给他进行解答,就真正成为了球迷在收看比赛时候的好朋友。
Robin:我相信这一天一定会到来的!而且对于度秘来说,篮球和其他的比赛没有任何区别,都是学习知识,它主要的能力还是不断地学习人的思维方式和表达方式。
杨毅:我相信它肯定会越来越好。
Robin:谢谢杨毅。
Robin:这是有关自然语言理解的一些介绍,下面再给大家展示一个自然语言理解的应用。这个应用的领域其实也不是特别新,就是自动翻译。你要想把一种语言转换成另外一种语言,你必须得理解这种语言在说什么。它不是简单的把语音转成文字,更多的是需要你知道它是什么意思。今天的百度翻译已经可以支持27种语言、数百种不同方向的对译了。现在我们来看一下百度翻译有多大程度上能够理解人的自然语言。
Robin:这其实不是一个演示,这是一个实际的例子。今天当大家打开百度翻译,它已经具备了这样的能力。所以我们看到对于自然语言的理解一旦能够达到一定程度,它就又打开了很多新的可能性。