人工智能创新研究的核心是解决科学和工程问题

2018-10-22 09:59:36

目前在人工智能领域有种提法,认为“机器学习”是人工智能领域最能体现“智能”的专业分支。从发展历史上看,机器学习也是人工智能发展最快的分支,近年来人工智能技术的突破大都源自于此。机器学习致力于研究如何通过计算的手段,利用既有经验改善系统自身的性能。在计算机系统中,“经验”经常以“数据”的形式存在。因此,机器学习研究的主要内容,就是关于在计算机上从数据产生“模型”的算法,即“学习算法”。我们只要把经验数据提供给学习算法,就能基于这些数据产生一系列的模型,以指导如何面对新情况时提供准确的判断。

从早期的“符号机器学习”到如今一统天下的“统计机器学习”,机器学习逐渐完成了从偏重理论模型研究到实际应用研究为主的转变。其根本原因是由于计算能力的大幅提高,使得通过统计学和大数据研究得到的成果显著,并常常远超人类通过其他现有技术积累可以达到的水平。未来的人工智能基础理论创新,很可能来自于更加基本的认知科学研究。从人类应用的角度出发,有必要把统计技术和对科学背景的深刻理解结合起来。

上述观点的一个论据支撑是统计机器学习算法的前提是假设样本数据“独立同分布”。被认为代表机器学习未来的“迁移学习”,研究如何把一个预训练的模型用在相关的其他任务中,更是要求与迁移关联的双方的数据具备独立同分布的条件,这在很多科学和工程领域(尤其是力学领域)看起来是苛刻和不尽合理的。如何对数据的有效性进行验证,或是研究出能够用于“非独立”或“不同分布”的学习算法,是应用背景学科(如力学)专业人士应该深入探索的命题。

近年来机器学习里面最火热的分支是“深度学习”,由于硬件性能的大幅提升,深度学习采用了复杂度更高的算法,得到了精细程度和质量更佳的结果,但同时也加重了对数据量、数据源的准确性以及运算资源的依赖,而这种依赖性严重限制了机器学习应用的场景和潜力。如何用更少的计算资源和数据样本,解决更多工程和科学中的待解谜题?这也是大家所关心和期待的人工智能基础理论创新的核心命题。

收藏 举报

延伸 · 阅读