人工智能在自然语言处理领域的瓶颈2017年5月10日
讲道理人工智能现在处在上升期,在各个领域都有新的应用出现,表现还都不赖,理应前途大好,何来瓶颈一说?我来说说我的看法。
《如何阅读一本书》中提到阅读分四个阶段,在讲第三阶段分析阅读时介绍了一些阅读的方法,其中一个是“诠释内容与讯息”,说的是读者在阅读时,需要和作者达成词汇语义的共识才可以解读出正确的涵义。在处理词汇语义的过程中,又包含一个很关键的步骤:处理语言背后的思想涵义。高阶的处理方式对于机器学习来讲是比较困难的(比如诗歌这种很抽象的文字类型,同一个字、词在各个文章中的用意可能都不同)。为什么我这样说呢?机器学习是需要样本的,样本数量很少,甚至这种使用方式是唯一情景的时候,机器学习可以用模型按以往的使用方式去猜意思,效果往往不尽人意。
机器学习这个东西说白了就是归纳法的究极应用,前一篇 中也说到了归纳法需要假设无误的支撑,不像演绎法是基于事实的。可见阶段机器学习的成果只能跟上历史,并不能超越历史。
训练出一个可以做到基本对话的机器人已经被很多公司实现了,但离真正模拟人类各方面的语言还很远。可能需要真正的人类神经来训练阅读感受才能训练出一个普通人的模样,神经和感受又是五花八门,克服一些伦理上的障碍还需要慢慢推进。