/ Natural Language Processing

哥德尔, 语法, 和潜意识(下)

作者: Bill Wadge 译者: Mr.Kua / 2017.Jun.01 有删改

上次我们聊了很多哥德尔,却没有聊语法和围棋,这次是来填坑的。
上次,我们提到了,哥德尔的工作证明了有限事实和规则的集合是无法构成完备的数学体系的,根据经验而得来的知识是非常有用的,数学到最后其实就是一门实验科学。

那语法呢?对于自然语言来说,其实是一样的。先抛开语义不谈,单单就说英语这样的自然语言,其句法构成就已经无限丰富了,无法用有限的集合来描述。这同样对围棋也成立,要想掌握这些技能,你需要判断和经验。

哥德尔,语法,和意识(下)
是不是这意味着事实(语法)和规则(句法)就不重要了呢?也不是,它们同样重要,事实上他们是我们之所以是人类的重要原因。

比如,英语中大量的句子可以用这样的Backus-Naur形式表示:

<句子> ::= <名词短语><动词短语><名词短语>

麻烦已经随之而来,由于许多语言中动词短语需要跟名词短语的单复数搭配,一条规则变两条:

<句子> ::= < 单数名词短语><单数动词短语><名词短语>

<句子> ::= < 复数名词短语><复数动词短语><名词短语>

在俄语中,过去式的动词短语需要跟名词短语的性别搭配,well,两条变六条规则。

让我们回到英语的名词短语上来,一个巨头疼的问题就是定冠词The的处理,母语使用者从来没有想过,使用The是有规则的,例如,在人名前不能加The,在地名前也不能加The...但是反例出现了:"The Government","the BBC"...??

没法事先定义一套完整的规则来保证人们不犯错,我有许多说汉语,波斯语,韩语的学生们,他们的母语里没有定冠词,于是我不得不经常纠正他们,但新的错误似乎总也犯不完。

是不是觉得有一种不完全的现象出现了?不管制订多少规则,给定多少公理,总有一个合乎情理的句子用法超出了我们定义的范围。

而去定义这些规则来解释所有语言的做法正是那些自然语言处理的先驱者们所在做的。它们试图基于绝对的语法和逻辑来解释语言,最终却失败了,你永远也不可能找到足够的公理和规则。

玩国际象棋和围棋的人,最初都是从基本的规则开始,一条经典的规则是:棋盘上某一个局势可以走出的最大价值,等于对手最不希望见到的一步棋给他带来价值的绝对值。

这个规则,加上林林总总的终局推演,理论上是足够了,但实际还差得远。

所以接下来你需要启发式规则来衡量棋局(过卒之卒,控制中场,物质优势)。IBM做出了一套象棋的启发式规则,但是对于围棋而言这根本不可能。

但是AlphaGo打败了世界冠军们,它使用神经网络来处理数以十万计的专业比赛,还不知疲倦的与自己对弈数百万局。人类唯一给它的只有围棋的目的而已。它凭什么就能打败柯洁呢?

这可能跟人类的心智有关,更准确的说,跟“意识”和“潜意识”有关。

普遍知道的是大脑有两种工作模式,显意识和潜意识。大部分的数据处理都是在潜意识中进行,我们并未意识到这些处理的存在。潜意识如何工作?至今仍不明朗,人们猜测它牵涉到对矛盾的意识进行清洗,去除矛盾。潜意识在感情,直觉,感觉,判断,感知,美感,反应等等多方面操控着我们。

那些对围棋有过一些了解的人,通常会惊讶于大师们如何就围棋进行交流,他们使用类似于力量,厚度,味道(中文中有,弹、漏、洗、重、势、味道等等)的词语描绘局势。围棋老师鼓励学生用身体的直觉走棋,学习围棋更像是对潜意识的训练而不是对背诵的规则的应用。AlphaGo似乎就是应用着同样的原理。

剩下给显意识的也就只有规则和公理了。有意识和理性的心智就像机器一样随着某种算法运行。我不是在说人们其实与机器无异,我们同样依赖非顺序性的潜意识,显和潜意识相辅相成而为人。当你无视你的感情而做出选择的时候,你才是一台没有灵魂的机器。

在数学中,我们通过经验发现规则和公理。当我们找到那些对其有足够信心的规则之后,我们就会在其他未知领域中有意识地应用它们,一步步推导出根据经验无法单独得出的结论。

就是这样的二元协作,将我们与完全用潜意识行动的动物区分开来,赋予了我们人类万物之灵的地位.它给了我们在最喜欢做的事,和最应该去做的事之间,做出选择的自由。

它给了我们自由意志。


本文为作者授权发布,原文地址。转载请注明出处。