返回博客列表

机器为何难以理解人类语言?

2018年11月25日
6 min read
AI思考

Q0:机器为何难以理解人类语言?

首先可以想到的是算力的问题,不过今天不讨论这个。假设机器算力与人脑相当,看看有没有其他一些更关键的原因。

排除算力的因素,想象我们现在有一个人脑Brain A(或者一个相当于人脑的机器脑),要如何训练它呢?给一些训练数据供它学习,纠正错误,这样机器就能逐渐返回正确结果。不过这样只能算照本参科,算不上真正的理解。问题出在哪里呢?在于我们的Brain A缺少人类的感官。

回忆一下你是如何学习语言的。襁褓中的婴儿最先学会叫妈妈,他们把妈妈这个词与眼前这个温暖有安全感的生物联系在一起。从而建立了“妈妈”这个概念。整个过程中,有婴儿眼睛的图像识别,有父母语言的引导(爸爸指着妈妈说:“这是妈妈”),还有身体的接触与感知(躺在妈妈怀里),再加上多次训练强化。我们如何理解什么是苹果呢?在有了一些基本语言能力之后,父母会给你一个苹果,说:“这是苹果。”,这玩意闻起来有清香,你看了看,然后吃下了它,记住了它的形状与味道,从而建立了苹果这个概念并理解了“苹果”这个词。

Q0.1:什么是概念?

概念是一类事物的共同属性的抽象。

对比一下人类和机器学习语言的过程,不难发现,能否真正理解语言,关键在于概念的建立。机器无法建立概念,是因为缺少五感的信息的输入。

缺少五感会如何影响概念的建立呢?试想去掉视觉,一个盲人要如何理解苹果这个概念呢?他得吃一口,通过味道来判断。那么去掉所有感官,一个没有视觉,听觉,嗅觉,味觉触觉的大脑(我们的Brain A)要如何理解什么是苹果呢?理解不了。

有人可能会argue一下:不对啊,现在的机器已经能识别图片中的苹果了啊?注意,我们这里讨论的是概念的建立,单纯的图像分类器并不能处理语境中的苹果。比如“我吃一个苹果”这句话,如何不能建立苹果的概念的话,是无法与“吃”这另一个概念联系起来的。

Q1:那么,要怎么解决这个问题呢?

我能想到的有两种方法。

一是将人类的五感对应为五类输入,加入学习过程中,帮助机器建立和人类一样的概念。(例如,苹果是一个类球形红/青色,触感为Xi,闻上去是Yj,尝起来是Zk的一种物体)要实现这个目标,还有很长的路要走,现在对于触觉,嗅觉,味觉并没有很好的比拟的传感器。

二是将现有的一些传感器,加入到机器上,如麦克风,摄像头,甚至红外传感器等。不过这样一来,训练出来的机器可能是人类无法理解的,因为它们用了不同于人类五感的另一套基底(其他传感器)来描述世界。不过如果我们的目的是发展出智能,而不一定是人类能够理解的智能的话,这种方案是一种好办法。

Q2:剩下的问题

本篇所讨论的内容还局限于输入的层次。可以概括为:要形成相同的概念需要有相同的输入,这样,对于同一件事物,才能得到相同的属性描述。

剩下的问题还有:

  • 如何判断机器是否建立了概念?
  • 如何将语句拆分成概念?
  • 如何存储概念?(可能是一组代表属性的向量)
  • 有了概念后,如何生成语句?
  • ......

这些问题将在以后讨论(关于第一个问题我想到有解决方案,希望有空能早点写出来。感觉又开了一个坑。。)

评论讨论

使用 GitHub 账号登录参与讨论

加载评论中...