新闻动态
AI研习丨人工智能:从概念到落地

浏览次数:175 发布时间:2023-07-17 09:30:43

一、人工智能的起源

1956年夏天,达特茅斯会议正式提出了人工智能这一名称,并给出了人工智能的最早定义,是“制造一机器,该机器可以模拟学习或者智能的所有方面,只要这些方面原则上可以精确描述”。这个定义后来有了变化。现在常用的人工智能定义是明斯基1968年给出的,“人工智能是一门科学,它使机器做那些由人需要通过智能来做的事情”。通过比较,很容易发现,这个定义与初始定义已经有了重大的区别,其最重要的差别是去掉了“只要这些方面原则上可以精确描述”这个限定。对于去掉这个限定,至少可以问两个问题。第一,省去后有影响吗?第二,为什么可以省略?


• 对于第一个问题的回答是,有影响,还很严重,至少两个严重的后果。一是拔高了先驱者对人工智能的期望,强人工智能等由此而生;二是由于缺少了限定,任何人都可以对人工智能进行评判,而且评判好像都很有道理。有说人工智能其实做不了太多事的。比如,2011年诺贝尔经济学奖的获得者在大会上公开说,人工智能不过是统计学。统计学当然可以做很多事情,但是,指望统计学代替人工智能,理论上不可能,现实中不成立。有说人工智能的能力强得可怕的。比如,霍金在2017年4月27日的马斯克认为,2025年人工智能可以超过人类。


• 对于第二个问题的回答是,在达特茅斯开会时,那时参会人员的共识是:概念都是可以精确定义的。既然可以精确定义,就不用特别指出来原则上可以精确定义,而且这也是当时的一个普遍信念。这一点可以由希尔伯特墓碑上的著名铭文旁证:“我们必须知道,我们终将知道”,即对任何一个概念人们都是可以了解清楚的,即使现在不清楚,未来也可以了解清楚。1953 年以前这是常识,因为那时一直假设任何概念存在经典定义。如果是经典定义,概念确实可以精确描述;如果还没有经典定义,那只说明人们的研究还不够深入,需要继续研究。1953年之后大家可以对这个假设开始进行反思,这个反思传到人工智能界已经是很晚的事情。


概念的经典表示到底是什么意思?概念的经典表示由三部分组成,概念首先有个名字;其次有内涵表示,其内涵表示是假设概念可由一个命题来表示这个概念;最后,概念有外延表示。所谓外延表示是指这个概念所指称的对象所形成的集合。如果每个概念都有这样的经典表示,那就完美了。1956年人工智能起步时,共识是概念肯定存在经典表示,当然对于一个具体概念来说,如何发现其经典表示是一个问题。由概念的经典表示,客易发现概念的三个基本功能。一是指向客观世界的对象,表示客观世界对象的客观性。所谓的客观世界即物理世界,物理世界包括自然世界和人造世界。自然世界,就是天然存在的物理世界。人造世界,就是人造的物理世界,比如,人们现在用的电脑、住的楼房等,这些都是人造的物理对象。不管自然世界,还是人造世界,其中的对象都具有所谓的知觉感知特性,并不依赖于人的主观感受。简称概念的指物功能。二是指向人的心智世界里的对象。心智世界也是广阔无边的,心能够想到非常多的事情,很多事情都是人先想到然后再造出来的,甚至想到也造不出来,这和我们的物理空间也不一样。简称概念的指心功能。三是指向认知世界或者符号世界,表示对象的符号名称,这些符号名称组成各种语言,甚至符号空间。符号分为自然符号、相似性符号、象征符号等,常见到的符号产品像小说、皮影、元宇宙等,都有非常多的发展。简称概念的指名功能。


二、人工智能落地的途径

人工智能智能落地理论上好像不难。人工智能也是一个概念,如果使一个概念成为现实就需要实现它的三个功能。一是人工智能的指名功能;二是人工智能的指心功能;三是人工智能的指物功能。


(一)指名:符号主义

符号主义有物理符号系统假设:只要符号对了,对应的物理世界也就对了。所以只要保证符号的运算都正确就可以实现人工智能,按照这个思路已经发展出了非常多的思想和技术。比如:判断机器是否具有智能的思想实验。所谓的图灵测试基本上就是通过符号测试来的,就是在符号世界进行测试的。图灵测试有严重的缺点,当然它也有很多优点。在某种严格意义上说,现代人工智能的思想起源可以追溯到图灵测试。图灵测试最大的优点就是放弃了智能内涵定义的判定性问题,将研究智能的重点放在智能的外在功能表现,使得智能从工程上看似乎是可以实现和判定的。关于图灵测试的更多分析,请参考《图灵测试的明与暗》一文,在此不再赘述。


中文屋思想实验,已经证明即使图灵测试完美实现,人工智能也不同于人的智能。即按照实现概念的指名功能这条路线,人工智能实现不了人的智能,但可以实现人工智能或者机器智能。这方面也有很多发展,特别是机器证明上有了很大进展。比如,一些常见的欧式几何证明都可以做,吴文俊先生在这方面也做出了很重要的贡献。


当然这条人工智能路线也面临着非常多挑战。虽然中文屋说明,即使是完美实现了符号主义,人工智能也达不到人的智能。但符号主义真的能完美实现?实际上要完美实现符号主义,也是不可能的。因为要面临好几个难题。比如知识的组合爆炸问题。在符号主义下去实现人工智能,理论上由几个简单假设,可以把一切东西推出来,只要人类知识完备就可以这么做。但是上世纪70年代就发现,人类知识是不完备的。于是就退一步想,知识整体可能不完备,但是局部可能完备。如果知识局部完备就可以在局部做,这就是所谓的专家系统。后来发现,做到局部完备也很难,很多情况下局部完备也做不到,只能用所谓的常识来代替,但常识面临着太多问题:比如常识太多,难以穷尽,推理步骤不一定有限,等等。还有所谓的组合悖论,原来的句子看上去都没问题,但是组合起来就可以产生一些问题。一旦出现这种句子,说它真也好、假也好都不对,逻辑自身都有问题了。在符号主义的假设下,知识或者相关概念都使用的是经典概念,只有经典概念才可以斩钉截铁地说对还是不对,但是经典概念自身是非常难以得到的。总之,要想彻底符号主义,就面临理论上非常大的挑战。


(二)指心:连接主义

连接主义假设在心智世界里实现人工智能就可以了。心智世界由人脑实现。故连接主义假设能够模拟人脑就能实现人工智能。注意到人脑是借助于人脑神经细胞的联结实现自身功能,因此,模拟神经网络联结的人工神经网络成为连接主义的代表。现在,人工神经网络已经发展成深度学习。


对于连接主义,也有一个缸中之脑的思想实验。该思想实验假设可以用先进的手术把一个活人的脑子剥离出来,并放在营养液里,然后其神经末梢与电脑相连,人的各种感觉由计算机程序输入,感觉一切正常。在此情形之下,显然百分之百实现了连接主义。但是缸中之脑,否决了现实与心理的区别,这与正常人有重大不同。在这个意义上,连接主义实现的人工智能也与人的智能不同。


连接主义也有非常多的进展。先是在围棋上战胜了所有的世界冠军;接着在基础科研上也有重大突破,比如Alphafold2。但它也一样有自己的问题。彻底实现连接主义一样有极大挑战,虽然完全实现了也不是人的智能。到现在为止,人脑如何表示概念的机制并不清楚,包括概念的表示形式、表示方式、组合方式等。现在的神经网络与深度学习实际上与人脑的真正机制距离尚远。


(三)指物:行为主义

行为主义假设智能取决于感知和行动,不需要知识、表示和推理。按照这条路是不是能完全实现人的智能?可惜,哲学家依然给出了否定的思想实验。有两类人都具有极高的智能,一种是完美伪装者;一种是斯巴达人。完美伪装者和自己的心理完全没有联系,不管心理怎样,他在人面前可以伪装,需要他笑时就笑,需要哭时就哭,但他心里与外在的表现完全没有关系。而斯巴达人是不管外界怎么表现总是一副冷冰冰的样子,他心里不管有什么样的起伏,外表不变。但这两种人,都不是机器的模仿对象。因此,行为实现的只是人工智能而已,或者机器智能而已,与人的智能不同。


根据这条路,很多人都知道莫拉维克悖论,即困难的问题是简单的,简单的问题是困难的,最难以复制的人类技能是那些无意识的技能,模拟人类的行动技能面临很大挑战。这方面现代的成果,就是波士顿动力机器人。假如波士顿动力机器人,投入到现实中使用,也会出现很多人想象不到的问题。


三、人工智能的基本预设

到现在为止,人工智能的基本实现路径就三条,即行为主义、连接主义和符号主义。符号主义说实现指名功能就足够了,连接主义说实现指心功能就足够了,行为主义说实现指物功能就足够了。为什么这些主义都假设实现概念的一个功能就足够了?原因就在于,三个主义提出的年代里,都假设概念存在经典表示。如果所有的概念存在经典表示,概念的三个功能确实等价。在这种假设下,实现一个功能,也就等于实现其他的两个功能。这样沿任何一条路径实现人工智能,等于其他两条路径也都实现了。现实生活中也经常采取措施保证三指等价,比如政府、学校、法律、警察、军队、监狱等的初心都是用来保证三指等价的。


概念的经典表示有六个预设,一是概念存在外延表示,且用经典集合论表示;二是概念存在内涵表示,且用命体表示;三是概念存在概念名表示,且用语言表示;四是概念的内涵表示和外延表示同名;五是概念存在同一表示,即同一概念的表示与个体无关;六是概念的内涵表示和外延表示用来指称对象时,功能完全等价。


在现实生活中,这些预设不一定正确。比如,概念的指名指物这些功能不一定等价。有一个段子,说“手头有一个亿,我们要赶紧去投资,不然就洗手不干了。”一般来说,手头一个亿是真的有一个亿,段子里就只是指名非指物;只是在指头上写了“一个亿”这三个字而已,洗手不干了也真的是洗手,一洗手这三个字就真没了。段子就是充分利用了概念的指名、指物不等价,如果等价了这个笑话也就不好笑了。另外一个例子,西方绘画史上有一幅著名的画作,画面上画一只大大的烟斗,同时用法文大字题注“这不是一个烟斗”,这幅画也是利用了概念指名、指物不等价的一个著名例子,画里的烟斗在符号世界里是一个烟斗,属于相似符号,不是物理世界(真实世界)的真正烟斗,这个烟斗不能用来抽烟,但它确实在符号世界里是一个烟斗。当概念的三指等价,又怎么能说这不是一个烟斗?当三指不等价时,它真的就不是一个烟斗,只是烟斗的画像。我们以前说到美术走向时,只有三者等价才有所谓的写实,如果三者根本不等价写实就没有意义了,因为再写实也不实。所以美术界有很多奇怪的作品,从概念具有三指功能方面就可以很容易理解。


概念的表示理论有很多进展。


在概念外延表示方面,隶属度从经典的非0即1,发展到模糊集理论、粗糙集理论等。


在概念的内涵表示方面,维特根斯坦对于概念有所谓的命题表示,提出了严重的质疑。通过深入分析游戏这个概念,彻底否决了游戏能用一个命题表示这一想法,明确指出概念不一定有命题表示。更详细的分析,可以参考1953年出版的《哲学研究》这本书。经过了25年的反思之后,人们认可了维特根斯坦的观点:概念到底有没有命题表示需要具体研究,但概念没有命题表示也并不表示概念没有内涵表示,1978年以来人们提出了概念原型理论、概念样例理论等。到现在为止,概念的内涵表示理论一直在发展。


在概念名方面,概念名也不一定存在。维特根斯坦在《逻辑哲学论》里说:“确实有不能讲述的东西”;哲学上还有一本名著《个人知识》,里面说到有默会知识和隐性知识,有些虽然说不出来,但是并不是不会。


在概念内外同名方面,假设概念的外延表示和内延表示同名,也与实际不符。西方社会心理学的研究表明:日常生活中成人日均说一次谎。在中国历史上也有一个《指鹿为马》的故事,心里知道它是鹿,但就说是马。显然内涵表示与外延表示不一定同名。


在概念的唯一表示方面,涉身认知科学已经指出,大多概念依赖于个人的自身感知条件,不可能与他人一致。比如一个数字,由于站在不同的点上,有的人看到的是6,有的人看到的是9。


在概念的指称等价方面,概念经典表示要求内涵表示与其外延表示在指称对象时功能等价。在现实生活中,这一要求大多时候成立,也不是没有理论支持,比如《如何以言行事》里说到“我们的话就是我们的契约”,王阳明的知行合一等。但是,知行分离的情形并不少见,双标的行为是很多的。


综上所述,现实生活中概念的三指功能并不一定等价。如果三指不等价非常少,就可以个案处理。可惜的是,三指不等价虽然远远不如三指等价常见,却不能个案处理。在非自然科学的范围之内,如何处理三等不等价的情形至关重要。下面举例说明。


哲学上,并不总是假设三指等价。奥斯汀《如何以言行事》论述了语言与行事之间的关系,即指名与指物的关系,说的就是言行不一定等价。有时言即行,行即言;有时言非行,行非言,指名和指物有非常复杂的关系。《公孙龙子》中《指物篇》也区别了指名与指物的区别,“物莫非指而指非指”。


军事上,《孙子》中开篇就说到“兵者,诡道也。故能示之不能,用而示之不用,近而示之远,远而示之近。”军事上是很难相信敌方三指等价,这也是空城计能成功的原因。


历史上,三指不等价的例子就更多,比如萧良自污,指鹿为马。


政治上也是一样,马基雅维里《君主论》中整整两章说到论君主应当怎样守信、怎样避开谄媚者,从这些可以看出三指明显不等价。


会计审计学也是著名的三指不等价。账实一致从来不是会计学特别是审计学的基准假设,如何保证账实一致,一直是会计学和审计学的基准课题。朱镕基就曾经说,我希望每一位国家会计学院的学生,永远都要牢记这四个大字——不做假账。


文学上也一样,很多文学形式也是三指不等价的,像穿越、玄幻、神话、童话、浪漫等类型的文学,夸张、比喻、泥人、拟物、通感等修辞也是三指不等价,这些只能在符号世界,最多是心智世界,绝对不是物理世界的事情。比如《孙悟空三打白骨精》,孙悟空、白骨精都是假的,但我们仍然看的津津有味,因为大家知道它不是物理世界的,我们能想像到这些,所谓心智世界也是人智能的表现。


三指不等价的更具体例子,也是有的,比如“空手把锄头,步行骑水牛”,在物理世界不可能,心理世界也不可能,在符号世界中却已经是现实。英文也有这种例子,比如“a rod without length”,现实世界、心理世界都不可能,文字世界、符号世界里却并非孤例,所以符号世界不同于物理世界、心智世界。在符号世界里不一定都是文字,比如绘画作品也可以是符号世界;皮影戏也是符号世界。而且符号世界非常发达,发展成所谓的符号空间,比如互联网、元宇宙。越来越成熟的符号世界,与现实世界越来越失去所谓的等价性、相关性时,对人们的生活不一定全是好消息。


当概念的三指不等价时,符号主义的目标是指名正确,保证不了其指物、指心正确;连接主义的目标是指心正确,保证不了其指物、指名正确;行为主义也一样,其努力保证指物正确,保证不了指心、指名正确。


在三指等价时,人工智能至少努力不骗人;在三指不等价时,现在的人工智能有时真骗人。比如怎么样鉴别数据真假已经成为亟待解决的大问题。


四、其他人工智能的常识

统计上看,概念的三指等价还是最多数的情形。因此,当前人工智能的基本假设还是概念的指心、指名与指物功能等价,在这种框架下机器有时显得极其智障,缺乏常识和理解能力,有时严重缺乏解释能力。由于当前人工智能技术和应用已经足够丰富,并且日新月异,有一日千里之势,已经为人工智能理论研究提供了足够丰富的实例和素材。借助于这些研究结果,在知道概念的三指等价假设之后,我们有理由相信,未来人工智能可能发展更好。


根据概念的三指等价假设,可以知道有些人工智能名词的谬误之处。比如通用人工智能或者强人工智能、人类级人工智能。在概念三指功能等价的假设下,人工智能超过人类的智能很难,因为人类的智能不一定要三指等价。如果假设强人工智能能够实现,就会面临逻辑和伦理的悖论。比如:假设强人工智能已经物理实现,必然存在一个强人工智能系统。对此物理系统,同样有成住坏空四个阶段。那么,该系统,谁来生产?该系统的性能,谁来评估?该系统的故障,谁来维护?该系统老化了,谁来更新?类似这样违背逻辑的悖论问题是很多的。


根据上述分析可以知道,必须要批判强人工智能。理论上来说,强人工智能等没有实现的可能。著名的强人工智能骗局如“女机器人索非亚”,一看就是骗人的。对具体的人来说,每个人的能力都是有限的,非通用的,没有人万能通用。可以落地的人工智能也一样。


最后说一点,现在人工智能的发展对教育提出了很高要求。通过多年发展,在中国,每个人的受教育程度都提高了很多,导致我国整体水平也在提高。人工智能与其说是一新技术,不如说是一新时代,人工智能时代和非人工智能时代也有巨大代差,可能远大于冷武器与热武器时代之间的差别,弥补人工智能时代与非人工智能时代的代差,唯一要求是提高人类自身知识水平,特别是人工智能知识水平,这对于人工智能界提出了很高要求,让我们共同努力!