百度大脑之图像识别能力

2016-09-01 16:12:05

9月1日上午消息,百度2016年世界大会今日举行,本次百度世界大会以“人工智能”为主题,百度公司创始人、董事长兼CEO李彦宏围绕人工智能发表了主题演讲。李彦宏重点介绍了百度大脑的四个功能:一个是语音的能力,一个是图像的能力,一个是自然语言理解的能力,还有一个就是用户画像的能力。 

百度大脑之图像识别能力

图像识别方面则主要用于四个方面,首先是人脸识别,通过捕捉人脸关键点,形成人脸表情网,实现人脸的准确识别;其次是被应用于百度地图等方面,百度地图与图像智能识别技术的结合,可以让数据无限逼近现实世界;此外,最关键的使用在于百度无人驾驶,利用计算机视觉,可以加快无人车的研发。最后,图像识别还将应用于AR领域,可以提高广告主的营销效果。

用一个比较专业的术语来讲,我们叫做计算机视觉。这也是现在广义的人工智能中非常重要的领域。说到图像的识别,我想大家自然而然会反应出来一个什么应用呢?应该就是我们通常讲的人脸识别的应用。人脸识别的准确率今天已经达到了99.7%,已经非常非常准确了。现场的屏幕能够识别出来我们一些嘉宾,根据他们的人脸,我们知道这个人是谁,这个准确率已经比较高了。刚才进来的时候,大家也可以看到一些人脸识别的展台,我们是可以识别很多很多人的面孔的。

那么,人脸识别这个技术是怎么实现的?我们要对人脸的特征提取它的关键点,把这些点打出来之后要做一些处理,把它连成一个面部表情,据此来识别这样一个人。这就使得当一个人的表情发生变化的时候,我们仍然能够识别出来这个特点是没有发生变化的,比如他在哭,他在笑,他在愤怒,他在迷茫,他的表情是不一样的,但是他的表情特征是不变的,所以我们仍然可以很准确地识别出这样一个人。

除了面部识别之外,图像识别还在很多领域也有应用。我们再看一个,这是上海的一个全景图,大家使用百度地图有时候需要看这样一个景,到一个陌生的地方之前,想看看到那看到的样子是什么。当然,这个图不是一个简单的图像的采集,我们采集了图像之后要对图像中各种各样的目标进行识别,这个大楼是什么样的大楼,那个路牌上面写的什么字,对写的这个字识别的话,跟人脸识别还不太一样,这里面有一个特殊的图像识别的技术就是OCR,这个是二十多年前我们的一个专利,到今天它的准确率已经非常高了,下面我们也是用一段视频给大家看一下百度地图是如何利用图像识别的。

这是百度地图利用图像识别的情况,其实还有一个很重要的领域也是非常需要图像识别的技术,这个领域是什么呢?这就是我们过去一年来讲得比较多的无人驾驶汽车。无人驾驶汽车涉及到很多很多的技术,比如说我们需要计算机视觉的技术,需要高精度地图,需要对环境的感知,需要定位,甚至需要语音的通话。但应该说,计算机视觉或者是图像识别的技术是“最后一公里”,无人驾驶汽车真的要变成没有人,真的要能够解决99.999%、甚至100%的情况,最终还是要依靠计算机视觉的能力,要识别各种各样的极端的情况。

去年年底开始,我们给大家展示过百度的无人车在五环上跑,在高速上跑的情况,过去一年左右的时间我们也花了不少精力去提升我们在城市道路上运营的水平,下面我们也放一段视频给大家看一下。

大家看到左下角这是人能够看到的视野,这个视野其实是比较窄的,主屏幕是无人车能够看到的路面情况,大家可以感受到,它感知的范围其实比人要宽了很多,很多比较远的目标都可以感知到,每个目标都给出它唯一的编号进行识别。对面有什么车过来了,遇到红绿灯,遇到障碍怎么办,行人怎么能识别出来,或者是树木,周边的汽车等等,每一个目标我们都进行了识别和编号,这就是实际的、一个百度无人驾驶汽车在城市道路中行驶的情况,上面的45是限速。

这是大致的一个车看到的世界是什么样的。这里面涉及了很多计算机视觉或者是图像识别的技术,尤其是这两个技术:一个是我们叫做车辆的检测,你行驶过程中怎么能够知道旁边有车辆,这个车辆在哪?这个车辆的检测我们现在按照国际权威的评测来看,车辆检测的能力,百度无人车已经排名第一了。还有一个很重要的能力是车辆跟踪的能力。这个不仅是全自动的无人车,即使是对半自动的、高度自动驾驶来说,也是一个很基本的能力。你怎样能够准确地跟着前面的车走,这个技术在包括准确性、全面性、连续性等六项指标中,我们已经有四项拿到了第一。

这是无人车对于图像识别依赖的情况。我们再给大家展示一个领域,就是增强现实AR,AR其实也是非常依赖(图像识别)。拿着手机拍一下现实的情况,我们要能够识别出来这是哪,这里面有什么,然后才能跟用户进行互动,才能产生真实世界和一些虚拟世界的完美的结合。那么这个东西有什么应用呢?我们也觉得很高兴我们的周总、我们的广告主非常敏锐地把握到了这么一个机会,他说OK,我可以把现实世界中我的产品和虚拟世界中我希望用户感知的东西结合在一起,这样的一个做法也可以说是一种新型的广告形式,下面我们就来看一个具体的例子。这是我们跟欧莱雅中国合作的一个例子。我们放视频。

所以大家看到无论你拿手机拍一张明信片,还是拍一个实物的洗发水,它都可以准确地识别出来这个东西,和用户进行互动,这里面不仅有图像识别的技术,也很大程度上取决于广告主的创意,如果创意和这个技术结合,对消费者的吸引力也非常大,所以我们也期待将来的时间和客户很好地合作,把这个创意,把最优秀的想法和最优秀的技术结合起来,给消费者带来实惠。


收藏 举报

延伸 · 阅读