百度宣布开源人工智能代码
继谷歌和Facebook宣布开源人工智能相关技术后,百度也表示开源人工智能代码,希望借此在人工智能技术的标准发展中掌握主动权。
百度硅谷实验室已经向GitHub上传了Warp-CTC C代码库。与此同时,百度在一篇博客文章中鼓励开发者试用这些代码。百度研究院在CTC的基础上开发了自己的系统,优化语音识别产品。百度表示,Warp-CTC所需的存储空间较小,比普通CTC速度快数百倍。
关于开源的原因,百度称希望使“端到端的深度学习变得更简单、速度更快,加快研究者的进度”,而“此前的代码在训练端到端网络时速度太慢”。百度还表示,将向机器学习社区贡献该公司开发的一块重要代码。
百度研究所首席科学家 Andrew Ng 称他的研究主要是人工神经网络如何在图形处理单元 (GPUs) 上运行,让 WARP-CTC 实现对 GPUs 和 x86 CPUs 的支持。
connectionist temporal classification (CTC) 方法可以追溯到 2006 年,在 Swiss AI 研究所 IDSIA 论文上有记录。 百度研究所开发的 WARP-CTC 就基于 CTC 方案,但是改进了其自身的语音识别功能。
CTC 方法包括递归神经网络 (RNNs),在深度学习的 AI 上越来越常用。递归神经网络已经被证实可以在嘈杂的环境下很好的运行。
Facebook, Google 和 Microsoft 等等一些大科技公司都相继开源了他们的 AI 软件,当前 Facebook 还分享了其 AI 服务器硬件设计。百度也往前迈出一大步,为学术论文做贡献。已经有大量的 AI 软件开源,百度研究所之前开发的进度一直比较缓慢,所以现在把代码共享出来,希望通过机器学习社区继续提升 WARP-CTC。