百度联手智能家居巨头peel实现跨设备无缝访问

2016-04-13 20:57:49

近期美国硅谷举行的GPU技术大会上,百度展示了与Peel合作的技术成果,将Deep Speech语音技术与Peel的智能遥控强强结合,用户通过语音指令,可实现在直播电视、DVR、流媒体内容的跨设备无缝访问,从而取代传统电视机顶盒遥控器。用户可以使用语音来随意选择机顶盒和有线电视中的电视剧、脱口秀,或者美国总统选举等直播等节目。

据悉,Peel公司开发的智能终端应用产品已惠及200个国家的1.5亿用户,中国的用户数量位居全球第二。除了技术输出,百度也将充分利用Peel在智能遥控领域的数据优势,反哺智能生态。此外,百度表示将与多家公司开展合作,将深度语音技术应用到更多的智能家居之中,为用户提供更加便捷的生活。

百度硅谷人工智能实验室负责人Adam Coates称:“语音识别技术正处在关键拐点上。未来,用户对设备讲话就如同与人面对面交谈一样轻松。我们很看好与Peel的合作前景,双方将共同努力为用户带来更好的体验。”

此前,百度硅谷人工智能实验室利用端对端深度学习技术研发了Deep Speech语音技术,用于提高在嘈杂环境下的英语语音识别的准确率。在噪音环境下,Deep Speech语音技术出错率要比谷歌、微软以及苹果的语音系统低10%以上。过去一年中,百度硅谷人工智能实验室的研究人员不仅提高了英语语音识别的表现,还加入了汉语普通话语音识别的功能,识别准确率高达97%,并被美国权威科技杂志《麻省理工评论》列为2016年十大突破技术之一。

除了专注于语音技术的研发,百度还积极推动智能语音产业的快速发展。早在2013年,百度便上线了语音开放平台(yuyin.baidu.com),将语音识别、合成技术能力全面开放,并承诺永久免费。目前,百度已为联想、小米、索尼、中兴、乐视、特斯拉、海尔等在内的不同行业的企业提供技术开放,接入方式包括SDK及自主研发的REST API等入口,供开发者选择。

water_201601191101354692.jpg

参考阅读:百度Deep Speech2语音技术的实力

百度之所以能够成为唯一一家中国公司入选《麻省理工评论》,根本原因还是在于其技术实力的原因。早在2014年底,百度首席科学家吴恩达及其团队就发布了第一代深度语音识别系统Deep Speech,该系统使用了端对端的深度学习技术,并且经过公开测试其在噪音环境下的出错率要比谷歌、微软以及苹果的语音系统低10%以上。

汉语的语音处理技术有着两大难点。

1)字符数据量极为庞大,英文字母只是在26个字母中进行组合,并且元音辅音等发音规则基本都很清晰,识别字母较为容易,但是汉语则有着8万个字符,同音字这么多,要根据某个字的发音来判断具体是哪一个字,所需要关联的数据远超英文。

2)多义词的问题,中国文字之所以叫象形字,就是因为其一个词都可能有着无限意义的延生,而同一句话中,一个词语的声调高低都有可能改变到整句话的意思,这需要被识别出来。

而百度的Deep Speech的技术处理则是。

1)常用词汇预处理,百度通过收集常用词,筛选出常用词汇,减少预处理环节,这其实就是百度搜索引擎本来的优势,搜索引擎中那些用户搜索的词汇都能是常用词构成,这些海量的词汇大数据构成了百度语音技术的基石。

2)深度神经网络输出,深度学习要想成功,取决于规模庞大的基于GPU的深度学习基础设施。通过使用批处理技术将DNNs部署在GPUs上,Deep Speech2的语音识别表现出了极高的训练效率,目前该系统支持超过26万亿次浮点运算,可在几天内完成深度语言的集中训练。

百度的大数据以及相关技术的积累,为语音技术提供了极好的燃料以及设备,此外百度的语音技术也是百度当前投入的重点,并且百度语音其实还取得了其成绩,在今年的中国电子学会科学技术奖项评选中,百度翻译也同时获得了进步奖,而百度翻译技术是翻译技术+语音技术的结合。


收藏 举报

延伸 · 阅读