环信开源国内首本免费深度学习理论和实战图书专著《深度学习理论与实战:提高篇 》,内容涵盖听觉,视觉,语言、强化学习和哲学等,七百多页详尽的理论和代码分析。本文节选自《深度学习理论与实战:提高篇 》一书中的“哲学篇”上半部分:人工智能究竟能否实现?自有意志是否存在?是否存在完全客观的世界?生命是什么?让我们带着这些问题来一探究竟吧......

5c99fbce95d1e.jpg

图书作者李理,环信人工智能研发中心vp,有十多年自然语言处理和人工智能研发经验,主持研发过多款智能硬件的问答和对话系统,负责环信中文语义分析开放平台和环信智能机器人的设计与研发。

意识是人们用来挑战人工智能的重要武器,基本的观点就是人有意识,有主观能动性,因而可以创造性的解决问题。而机器,不管是预先编制好的程序还是神经网络模型,都是被动的按照人设计好的模式来运作。因此它实现的肯定不是真正的智能。

什么是意识,并没有一个获得广泛认可的定义。但是很多人认为人能”意识”到自己的行为,从而可以自主的做出一些决策,因此是存在”自由意志”的。

根据[wiki[(https://en.wikipedia.org/wiki/Consciousness),意识就是”我”知道、发现、觉察到某个东西,可以是觉察到外部的物体,也可以觉察到自己”内心”的某些感受或者想法。

关于意识的解释有很多的观点和理论体系,但可以简单的分为两类——存在意识的二元论和不存在意识的一元论。

理论上应该有四种组合——只有物质、只有意识、物质和意识同时存在以及两者都不存在。两者都不存在似乎很难想象,持有这种看法的人好像比较少见。作者也很难想象这是两者都不存在的世界是什么样子,也许世界什么也不是,既没有物质也没有意识,那我们的感受从何而来呢?

接下来我们讨论一下二元论,这种观点是比较自然的。接受科学(这种信仰)的人大都认为存在一个物质的客观的世界,因此物质是存在的。而我们又能够感受这个世界并且意识到自己的感受,而且”看起来”它的工作方式又和物理世界的规律不太一样,那么假设存在另外一个非物质的意识就是很自然的事情了。

二元论的代表人物是笛卡尔,笛卡尔认为世界上存在两种完全不同的东西,一种是意识,一种是物质。其中意识能思考而物质不能思考,物质占据空间而意识不占据空间。即“物质的本性是广延,精神的本性是思维”。

之所以笛卡尔坚持认为意识和物质是完全两种不同的东西,他持有的是两个论据:其一,物质不能思维。我们在直观上通常不会认为一块石头、一块肉甚至是布偶玩具会和人类一样具有意识。其二,精神的存在似乎不依赖空间。在前现代,古人很难知道人的意识活动到底发生在哪里。古埃及人认为人的思考发生在心脏,古代中国人对于容纳意识的场所的认识是混沌的,诸如胸有成竹、腹有诗书气自华等比喻。古代西方人则更加粗暴地把意识归结为一个形而上的灵魂概念,认为人的灵魂即是一个人的精神存在,灵魂可以脱离肉体生存。

因此他认为意识和物质是两种完全不同的东西。但是这有一个问题需要解决:物质和意识是什么关系?

一种观点可以认为它们之间没有任何关系,但是近代的科学发现人类的感觉器官——类似于机器的传感器——是物质的,可以用物理学规律来解释。比如我们之前介绍的语音识别系统的MFCC特征提取,一定程度是模拟了人类的听觉系统。因此二元论通常需要解释意识和物质的关系,谁是决定性的因素而谁又是从属的因素。

通常有两种观点:物质决定意识和意识决定物质。当然还有物质部分决定意识的观点,但是我认为这种观点可以归为意识决定物质,因为我们可以把被物质完全决定的部分划分到物质里去,而剩下那些就是完全不被物质决定的由意识自作主张的部分。因此分歧的关键点在于物质是否完全决定意识,或者说意识有没有可以”自由”的时候,也就是”自由意志”是否存在的问题。

如果承认物质完全决定意识,那么意识不过是物质的另外一种说法而已,这就可以回到一元的物理主义。因此包括笛卡尔在内的大部分二元论者期望留给意识和自由意志足够的空间,从根本上来说他们认为意识是决定物质的。

在他们看来,意识就是指挥家,而我们的由原子等物质组成的身体是被指挥的对象。意识说”我”要走路,因此身体就按照意识的要求开始走路。但是随着生物学和神经科学对大脑的研究,人走路是大脑通过化学的(因而也是物质的)神经系统发出信号给肌肉,肌肉控制人的四肢开始移动。这样就出现了问题,既然大脑可以完成这个指挥家的工作,那还要意识做什么呢?这个时候二元论者有两种解释:

1. 退让一步,走路这种事情动物也能做,这种”低级的”工作就让给物质的大脑吧;

2.还是意识控制,意识控制大脑然后大脑再控制神经系统。

不管哪种其实都让二元论者很尴尬,就像最早断定机器下围棋下不过人类,他们找出各种的”理论”来”证明”围棋有多么难解。但是通过前面AlphaZero,人类下了几千年的围棋还比不上机器几个星期的强化学习。他们没有办法证明人工智能不能实现,不断的退让很容易一溃千里。而第二种解释又显得很笨拙,它没法回答意识怎么控制大脑的问题。这种碰到问题然后引入一个概念,把所有不能回答的问题都推到这个概念的做法只是在逃避问题。这其实是科学和非科学的最大区别,也就是在遇到问题的时候科学可以承认自己无法解释,但是它绝对不会阻止人们持续的探索,它相信(信仰)最终会有一天能解决,即使代价是要推翻自己以前的结论。而非科学在遇到困难的时候经常会创造一个新的名词,用这个名词来解释(其实都不能叫解释,只能说是回避)遇到的困难。这个名词通常是人(至少普通人)不能去碰触的,意识(灵魂)就是这样的一个名词。

显然意识是不能遵循物理化学等物质世界的规律的,那么它是怎么运作呢?它又是怎么控制我们物质的身体的呢?我们的身体死亡之后灵魂归于何处呢?当然他们给不出科学的解释,因此通常的答案是灵魂遵循的不是物理世界的规律,因此人(至少普通人)是没有能力去探究这些问题的。所有讨论就到此为止,没办法进行下去了,因为他们已经不给你讨论的机会了。比如你说灵魂如果是不灭的,那么灵魂的数量应该是固定的,那么现代人比过去多了很多,这些多出来的灵魂是从哪里来的呢?我们没法直接”制造”灵魂,但是我们通过生育更多后代是不是能”制造”更多灵魂——假设每个人都有不同的灵魂的话。这些问题都没有办法验证了,怎么解释都可以。如果出现不能自洽的解释也很容易解释:这不是物理世界,它们不需要遵循物理世界的规律,包括逻辑。是的,我们在看《西游记》的时候不会去分析孙悟空七十二般变化是否遵循了物理学的质量守恒定律,也不会考虑一个筋斗十万八千里是否超过了光速。

另外一种二元论就是虽然有意识,但是它完全被物质决定,它遵循的完全是物理世界的规律。这种二元论作者认为基本可以归类到物理主义的一元论里。

物理主义认为世界是由物质组成,并不存在特殊的超自然的空间来安放意识。但是意识和普通的物质是有一些区别的,它是和人类的大脑、情感、语言和智能等等活动密切相关的。因此物理主义也不能简单的回避这个问题,虽然他们可以说大脑产生了意识,而大脑不过是一堆基本粒子的复杂物理化学作用。但是他们还是需要解释为什么这些粒子的运动就能产生意识,而石头里的原子运动就没有意识(假设我们认同石头是没有意识的)。

作者是倾向于物理主义的观点的,因为这至少为人工智能打开了一扇门。而如果认为意识是非物质的,那么即使我们的智能机器能够实现人类的各种智能行为,不管是下棋还是自动驾驶,都不能算真正的智能,原因就是它没有非物质的意识,我们无法创造出非物质的意识塞到机器的大脑或者CPU里。

物理主义也有很多不同的流派,作者下面会尝试根据自己的理解(可能来自不同的流派)从物质世界的角度来简单的解释意识是什么。

简单的解释就是:意识并不存在,它只不过是大脑的一种工作状态。比如”我”的肠胃给大脑发出饥饿的信号,大脑在处理这个信号的时候就处于”饥饿”的状态,当然它经过计算发现现在还要继续工作把这本书写完,因此它可能选择忽略这个信号然后把自己置为”工作”状态。但是这个解释有一个问题,”我”是怎么知道大脑处于这个状态呢?或者说大脑怎么把它的状态告诉”我”呢?这个”我”显然不是大脑自己,那么这个”我”是什么呢?是不是灵魂意识之类的东西?

在回答这个问题之前我们先看另外一个问题,假设有一个”我”存在,我们先不管它是什么,大脑为什么要把它的工作状态告诉”我”呢?如果根据作者的观点,物质决定意识。大脑的只是一台复杂的机器,它的输入是很多感官的输入信号,然后进行类似神经网络的复杂计算,最后得出计算结果。比如刚才的例子,大脑接到肠胃的信号,决定继续打字,然后它就发出指令控制手指敲击键盘就可以了。那它有什么必要把它的工作状态告诉”我”呢?比如我们用计算机来模拟这个过程,这是完全可以做到的,输入是饥饿信号,神经网络经过计算输出继续打字的决定。这就可以了,它有什么必要把决策的结果甚至某部分过程(为什么这么决策,可能是因为现在并没有那么饿,如果去干别的可能会打断写作的思路)也告诉”我”呢?如果是机器的话,这个”我”又是谁呢?

事实上大脑并不把所有的决策结果或者过程都告诉”我”,很多下/潜意识的行为,大脑根本没有告诉”我”。比如大脑一直在控制”我”的呼吸,但是它一直没有”告诉”我。直到我有点缺氧,大脑下指令做了一个深呼吸才告诉了”我”(或者是出现深呼吸之后听觉系统检测到了深呼吸然后大脑再告诉”我”)。

因此大脑似乎只是把一些重要的需要深度思考的决策结果或者过程告诉了”我”。告诉”我”这些决策结果和过程有什么好处呢?”我”会把它存储记忆下来,以后会用到它。比如上周滑雪,控制不了速度摔倒的记忆一直保存着,我们可以反思(强化学习)经验教训来学习提高滑雪技巧。

所以”我”只是一些大脑状态的存储和记忆,目的是为了在遇到类似的场景可以更好的避免同样的错误或者采纳之前成功的决策。根据强化学习的知识,判断某个决策是好是坏通常需要较长的时间,这些记忆可以用于后面强化学习。从这个角度来看”我”是不是有点像Deep Q-Learning的Experience Replay Buffer的作用呢?

前面也提过,大脑并不会把所有的状态都告诉”我”(也就是存储起来),因为我们的记忆容量(内存)是有限的。我们只能在有限的空间里保存最重要的信息,所以我们会不断产生新的记忆然后遗忘一些东西。

Replay Buffer里的一些数据在训练完模型后就没有意义了,就会被删除。即使删除,大脑在遇到类似的场景时也会做出正确的反应。作者在刚学会开车的时候有一种被过多视觉信息压得喘不过气来的感觉,开到时速60公里就感觉大脑处理不过来,而熟练了之后,即使在高速公路上开到120也觉得很轻松。这可以用上面的理论来解释:刚开始我们的自动驾驶模型还不够完善,很多路况都没有见过,比如插队行为在驾校里就从没遇到过,因此大脑需要复杂的决策过程,这些路况和决策过程都上升到意识层面并且存储到Buffer里。这么大量的信息让我们的大脑处于高速运转状态,甚至超出了它的处理能力,就像CPU的负载过高一样。随着Replay Buffer的各种路况被用来优化我们的驾驶模型,我们没见过的路况越来越少,大脑需要让我意识到的路况也越来越少,因此我们也越来越熟练和轻松。最终我们形成了条件反射,decision=f(路况输入),函数f就是我们的驾驶模型,它的参数已经高度调优。

我们日常所谓的熟能生巧其实就是上面的过程,我们从小学习走路、奔跑等都是类似的过程。到现在,我们很少需要思考怎么走路,除非我们碰到没遇到过的场景,比如在沼泽地、雪地、悬崖等我们没有见过的陌生环境。

一般情况下,我们的大脑是有富余计算能力的,因此我们的意识在不停的流动。所谓的流动就是我们大脑除了处理实时的输入,还有富余能力从Replay Buffer里不断的取出最近的一些场景来进行强化学习——调优我们的模型。但是如果需要实时处理的信息用光了我们所有的计算资源,那么我们就无法同时进行模型调优了。我们通常会有这样的感受,在经历某些复杂的事件时,比如在考试时,我们会完全”忘记”了自我的存在,全身心的投入到解答考题的过程中。又比如在初学开车的时候,总感觉手脚不够用,其实是大脑处于超负荷的运算过程中,还没有来得及把决策传递给脊髓从而控制肌肉的运动。这种全身心的投入是一种很特别的体验,我们会彻底忘掉其它的事情——包括那些烦心事,因为在大脑的优先级队列里当前任务的优先级最高。因此有的人会去做一些能够占据大脑CPU的事情,比如看恐怖电影、进行各种刺激的极限运动。这些事情通过占据大脑来让我们暂时的”忘掉”(其实是把记忆从内存换到磁盘)不愉快的事情。一些宗教也会有冥想或者禅定的行为,我不知道和这个有没有关系。

如果只是为了打发无聊时光的刺激性运动,过去也就过去了。但是像学开车,我们在Replay Buffer里存储了大量有用的新场景的训练数据,当时我们并没有时间反思(强化学习)。我们会在大脑闲下来的时候进行这些工作,因此休息和睡眠就非常重要。休息的时候,我们的四肢虽然处于放松状态,但大脑可能一直在做强化学习。在睡眠的时候,我们的大脑不需要处理实时的信息(其实也不完全是,只是我们的大脑忽略了大部分信号,但是一些紧急信号还是可以唤醒我们,让我们从休眠状态进入正常状态),因为这些场景大部分都是”历史”,因此没有必要再次告诉”我”,它默默的在后台强化学习就行。但有的时候某些重要的历史还是会重新被大脑以处理过的形式存储起来,并且形成新的意识,这可能就是梦的产生过程。

从这个角度,我们也可以解释劳逸结合的重要性。有一部分强化学习过程是在收集训练数据的过程中就完成的,但是如果收集数据过于复杂以致于大脑没有空闲资源学习,那么我们就需要停下来休息一下。

和强化学习类似,很多状态的Return是需要等到一个Episode结束或者一定时间以后才能知道。比如我们做了一个预测,也就是有了(s, a),但是这个预测需要第二天才能看到结果,因此Reward r当时是不知道的。所以我们需要把这个(s, a)存储起来,到了第二天,我们把r加上得到(s, a, r),就可以强化学习了,这也许就是所谓的”反思”过程。