新闻动态
人工智能研究中的几点思考

浏览次数:294 发布时间:2020-10-26 08:44:04

       语法学是研究逻辑符号与符号之间关系的理论;语义学是研究逻辑符号与其指称的事态之间关系的理论;语用学是研究逻辑符号所表达的解释者的思想之间关系的理论。


摘要:本文通过对人工智能的历史进行研究,指出目前人工智能界现存的几大瓶颈,即机器仍然无法形成常识、动机与智能决策。并从集群智能、软计算与混合智能系统三方面分析现在的人工智能主流发展方向,并给出作者自身的见解。

关键词:人工智能,动机,常识,决策,集群智能,软计算,混合智能系统 


引言:

      人工智能(Artifical intelligentAI)创立至今,已经度过了60余载。在这一个多甲子的时间里,有高潮也有低谷。目前AI正处于蓬勃发展阶段,但是也有一些现象如人机交互信息不对称、机器冷漠显得无生气、目前通用算法处理速度过慢等问题,而且机器的智能与人的智能相比,依旧相去甚远,这些都是制约当前AI发展的主要问题。本文将从历史-瓶颈-发展的思路入手,并引入笔者自己对于AI的一些认识与观点。

1.人工智能历史

     1956年达特茅斯会议的展开,宣布了人工智能学科的诞生。总体而言,人工智能的总体进展可以分为四个阶段:酝酿阶段、初步发展阶段、积累阶段与蓬勃发展阶段。

1.1  酝酿阶段

    任何事物的形成与发展都有一定的基础,人工智能领域也不例外。首先,在哲学领域,学者对于意识问题情有独钟。自从笛卡尔17世纪提出我思故我在的论述之后,有关意识的组成争论就从未停止过。托马斯·霍布斯、梅洛·庞蒂等人曾经明确反对身心二元论,前者认为是人是纯粹理性的,而后者认为身体和心理并不是独立分开的个体。可以说,这些哲学争论为早期的人工智能起到了很好的促进与推动作用。

      其次,在1943年,匹茨与麦克卡洛提出了著名的MP模型,他们将神经元视为二值开关,通过不同的组合方式可以实现不同的逻辑运算。该模型的意义在于其开创了人工神经网络的研究。1949年,Hebb提出学习模型,大体观点为,如果在突触前后的两个神经元被同步激活,那么这个突触连接增强。MP模型与Hebb学习规则的确立为后期的联结主义开了一个后头。

     在其他领域,现代计算机之父冯诺依曼于1945年提出了后来被称为冯诺依曼结构的工作原理,直到今日仍然被沿用。1948年,维纳在书中指出了神经系统与计算机工作的相似性,找到了他们内在联系,将自动控制的研究提到了一个新的高度,对后期人工智能学科的创立产生了巨大的影响。19361950年,图灵先后提出图灵机与图灵测试的概念,旨在于弄清楚计算机能做什么,如何定义智能等关键问题。维特根斯坦也对这个问题有所思考,他在著作《哲学研究》明确指出:机器肯定不能思维。

1.2 初步发展阶段

     人工智能初步发展主要领域在于公理证明。首先,纽厄尔和西蒙编写了一种名为逻辑理论机器(LTM)的智能程序,用来证明数学命题。与常见的数学推理过程不同,这种程序由结论出发,一步步从后向前分析,直到找出合适的证明问题为止。1963年,LTM程序证明了怀特海与罗素《数学原理》第一章中的全部定理。两年后,逻辑学家王浩和数理逻辑家鲁滨逊使用消解方法,使用机器证明了《数学原理》中的全部命题演算定理。

      另外,在其它研究领域也有了初步的进展。1957年,罗森勃拉特首次引入了感知机的概念,推广了联结主义的研究。几年后,模仿自然生物进化机制的演化计算开始出现,代表人物为荷兰德与福格尔。1965年,MIT人工智能实验室的罗伯兹编织了多面体识别程序,开创了机器视觉的领域。

1.3 积累阶段

     在初步发展阶段,各个领域都有了一定的进展。但是,这离当初设想的人工智能程度还所去甚远。1969年,明斯基与派波特发表著作《知觉》,其中写到知觉是不能通过像XOR(异或问题)的过程这样的逻辑处理的。这极大的打击了研究者的信心。20世纪70年代初,对AI提供资助的机构(如DARPANRC)对无方向的AI研究逐渐停止了资助。人工智能的第一次寒冬到来。

     在低谷阶段,人工智能界开始了反思。一派是以德雷福斯为代表,无情的对人工智能进行批判。他曾说道人工智能研究终究会陷入困局。而另一派则对人工智能抱有希望,代表人物为费根鲍姆,他认为要摆脱困境,需要大量使用知识。于是,知识工程与专家系统在各个领域崭露头角,比如MYCIN可以诊断一些特定类型的传染病。这个阶段(1976-1980)也称为复兴期。

      进入20世纪80年代后,人工智能界重新肯定了早期人工智能研究中神经联结方法与遗传算法。1982年,霍普菲尔德提出了Hopfield网络,引入了“计算能量”概念,给出了网络稳定性判断。1984年,他又提出了连续时间Hopfield神经网络模型,为神经网络的研究做了开拓性的工作。1986年亨顿(G.Hinton)、卢默哈特(David Rumelhart)和麦克勒蓝(James McClelland)重新提出了反向传播算法,即BP算法。值得一提的是,联结主义不同于符号主义,其研究方法巧妙的避开了知识表示所带来的困难。

      与此同时,布鲁克斯教授在1991年发表论文,批评联结主义与符号主义不切实际,将简单事情复杂化。他强调感知与行为直接联系,这也极大程度的促进了人工智能界另一学派-行为主义的发展。

      由此可见,在这一阶段,人工智能的研究空前繁荣,可是好景不长,1987年现代PC的出现,让人工智能的寒冬再次降临。人们普遍发现人工智能领域方面没有实质性的突破,而所谓的专家系统使用范围依然有限。于是,人工智能研究再一次陷入停滞。

1.4 蓬勃发展阶段

     1997年深蓝的胜利,使得人们重燃对于人工智能的兴趣。2006年,Hinton提出深度置信网络,使反馈深入到各隐含层之间,这也使得深度学习迎来了春天。2011年,IBM Watson参加“危险边缘”问答节目,并打败了两位人类冠军,轰动一时。一年之后,Google大脑通过观看数千段的视频后,自发的找出了视频中的猫,这其中运用了深度学习的技术。2016年,Google DeepMindAlphaGo,战胜了世界顶级围棋高手李世石,由此推动了人工智能的再一次发展。

直到如今,人工智能仍然处于蓬勃发展期。而且越来越多的学者希望人工智能向强人工智能转变,希望可以设计出真正像人类一样具有思维的机器,但事与愿违,效果并不理想。毫无疑问,目前人工智能仍然界存在着发展的瓶颈。

 2.人工智能的瓶颈

     相信很多业内从业者都有着这样的疑问,究竟我们能不能达到所谓的强人工智能,因为单从目前的智能程度来说,还远远谈不上人们想要达到的程度。近期AlphaGO的诞生,曾经使很多人眼前一亮,认为这是人工智能的新发展。但在笔者看来,AlphaGo只能在围棋领域有所建树,不能跨越到其它情景之中。搜狗CEO王小川也曾说过,现在的人工智能还存在很多弱点,即使在3个月后,AlphaGo也赢不下当初输掉的那场比赛。那么,具体的瓶颈究竟在什么地方呢?

     首先是动机性。动机,在心理学上一般被认为涉及行为的发端、方向、强度和持续性。动机也是有层次的,不同层级可以互相转换。Maslow1943年在《人类激励理论》一文中将社会需求层次与生理需求、安全需求、尊重需求和自我实现需求并列为人类五大需求。人处于不同的需求层次就会有不同的动机层次。有了动机后,人们的行为就有了指向性,这对于人的日常行为是非常重要的。那机器究竟能否形成与人类似的动机呢?让机器产生动机的一大难点在于动机是很难被表征的。目前还没有研究清楚的展示动机的形成机制,表征的必要不充分条件是具有可以被清晰表达的框架。而且动机的转换边界并不清楚,因此,动机的权重值便无从下手,导致计算陷入僵局。另外,动机还有意识动机与无意识动机之分。人工智能界目前对于意识层面下的内容还知之甚少,更不要提进行表征了。笔者认为动机与环境的关系密切,可以先考虑人在通用场景下的任务,给机器赋予一个动机值,当外界输入与动机匹配时,便赋予鼓励值,如果与动机重合度过低,则变换动机,使其符合动态环境。

     然后是常识。常识的定义为在一定的文化背景下,人们拥有的相同的经验知识。比较常见的有空间、时间、文化、物理常识。常识对于我们日常生活十分重要,尤其是在我们做出决定与判断的时候尤为如此。很多常识是潜移默化形成的,是文化与背景学习的产物。那机器如何形成常识呢?早在1959年,McCathy就已经想过让机器拥有常识以便得更加聪明。目前的人工智能界有两条方法来解决这个问题。第一条为让机器形成学习与观察周围环境的机制,就像一个孩子一样去学习,不过这样时间成本比较大,用户能否承担起这些成本还是未知数。明斯基曾说:常识是长期实践中总结出来的庞大知识体系,包含大量生活中学到的规则和异常现象、特性及趋势、平衡与制约等。第二条途径就是建立大型的常识库,并将其存储到电脑中。其中最为著名的为CYC项目,这个项目由Douglas Lenat1984年提出。首先通过采访与观察人的数据,然后知识工程师对这些数据进行处理,以CYCL的形式整理成数据库。当然,这个常识库的成本过于高昂。目前常识库中比较可行的思路为让互联网上的每个用户共同建立这个常识库,并在特定的网页使用不同的语言来进行编写。这样就能节省很多时间与金钱的成本,最为成熟的为OMCSopen mind common sense)。

      决策,无论是人类的日常生活,还是人工智能,最为关键的一步就是决策。如何让机器更加智能的进行决策,这是一个关乎到未来人工智能走向的问题。人类的决策机制主要分为三大部分:理性决策、描述性决策与自然决策。理性决策即认为人在决策时遵循着理性价值最大化的原则,比较具有代表性的有冯诺伊曼提出的最大期望效用理论,Savag提出的主观期望效用理论等。而描述性决策认为人在进行决策时不完全遵循理性准则。其中KahnemanTversky提出的前景理论是其中的代表。该理论认为,决策者依据价值函数、权重函数赋予选项不同的效用值,最终选取最大期望效用值做出决策。人也存在着启发式偏差,这会对决策产生影响。而自然决策专门研究人们如何在自然环境或仿真环境下实际进行决策。其中最著名的要属klein提出的再认-启动模型(RPD)。该模型认为人在决策时会依据以前的模式进行匹配。对于机器而言,进行智能决策可以借鉴人的决策习惯,可以将几种思维方式进行结合,并确认出一套判断机制,以便在特定情景下对决策行为进行抉择。例如,机器可以区分出时间与情景的压力,并建立起相对应的匹配机制,如当情景压力小时选择理性决策模式,而当时间压力大时选择自然决策模式等。

       由此可见,目前人工智能界对常识、动机与决策问题中的难点解决办法看起来还不是很多,但这确是目前机器智能与人智能之间差异最为显著的地方,也是目前整个行业的瓶颈之处。如何让下一代智能产品交互更有“温度”,这几个问题是必须要解决的。

3.人工智能的发展方向

      任何事物均有两面,行业的瓶颈的另一面就是未来发展的希望。目前人工智能界的研究方向主要分为以下三个方向:

3.1 集群智能

       也许很多人都有这样的疑问,人们的智能的时间代价是很大的,也就是说:机器很难承受这样的时间成本。集群智能(swarm intelligent)就是很好的解决方法。集群的含义为:一组相互之间可以进行直接通信或者间接通信(通过改变局部环境)的主体,这组主体能够合作进行分布问题求解这个概念源于人们对于生物界中鸟群、蜂群等生物的观察,人们发现在很多群居生物进行觅食、逃跑之时,往往个体没有复杂的行为,但群体的行为却涌现出复杂的智能现象。如蚂蚁能够将一块很大的食物搬到巢穴,并且遵循着最短路线原则。 Millionas 于1994年曾经提出集群智能的五大原则:分别为邻近原则、品质原则、多样性反应原则、稳定性原则与适应性原则。比较著名的集群智能有蚁群优化、粒子群优化算法和人工鱼群算法。

3.1.1 蚁群优化

    蚁群优化(Ant Colony Optimization,ACO)是一种利用人工蚂蚁的优化算法,由意大利学者M.Dorigo 等人于 1992 年首先提出。蚂蚁可以利用信息素对走过的路径进行标记,从而对路径规划进行优化处理。如果蚂蚁种群的数量够大,就可以根据信息素强度按照概率依次进行选择。并且在进行选择后,会进一步加强信息素的强度。蚁群就根据这种方法确定出最优路径。最典型的应用为旅行商问题(Traveling Salesman Problem,TSP),假定一只蚂蚁要在不同城市之间选择路径,且每个城市只能去一次。则公式(1)表明了选择下一个城市的概率。α∈[0,1],β∈[0,1]。

p=τ(r,u)α*η(r,u)β/k(r,u)α*η(r,u)β  (1)

其中两城市之间的信息素水平用τ(r,u)表示,候选城市与当前城市之间的距离用η(r,u)表示。α,β分别表示信息素和距离对路径选择影响的程度。公式所表达的为当前候选城市被选为下一个城市的概率。

 △Τijk(t)=Q/Lk(t)    (2)

公式(2)表明信息素的强化过程,Q为常数,Lk(t)为路线的长度,△Τijk(t)为分配到各条路径的信息素强度。由此可见,信息素的强度与路径长度成反比。

3.1.2 粒子群优化算法

   粒子群优化算法(Particle SwarmOptimization,PSO)于1995年经由Kennedy 和 Eberhart提出。其思想来源为鸟类的群体行为。模型具体抽象为一个包含M个例子在D维空间进行搜索。算法用到的公式为(5)(6)(7)(8)。

其中,粒子群的当前位置可以用XiXi1Xi2Xi,3…XiD)来表示,速度可以用ViVi1Vi2Vi,3…ViD)表示,粒子i迄今为止搜索到的最优位置为PiPi1Pi2Pi,3…PiD)。式中i23…M,d=1,2, …DW为惯性权重,c1c2为加速常数:r1,r2均为[01]之间的随机数,t是当前迭代数,T是总的迭代数。具体的流程见下图:


图1: 粒子群优化算法流程图

3.1.3 人工鱼群算

    人工鱼群算法(Artificial Fish-Swarm Algorithm ,AFSA)顾名思义,是受到鱼类行为启发的算法。其由李晓磊于2002年提出,是人工智能行为主义流派的典型应用。人类研究到鱼类的主要行为有觅食行为(AF-Prey)、集群行为(AF-swarm)、追逐行为(AF-follow)、随机游动(AF-random)等。以上几类行为对于鱼群的算法影响较大。所以在鱼群算法中,如何运用简单有效的方式来构造并实现这些行为就是很重要的问题。鱼群算法目前主要优点为:系统可以并行处理,具备全局寻优能力、对参数设定的要求不高、只需比较目标函数值等优点。虽然该方法目前还没有上述两种算法应用广泛,但已经应用到电力系统及物流系统规划中。


2:人工鱼群流程图

3.2 软计算

    软计算(soft computing)一词由Zadeh1994年提出,旨在解决传统人工智能计算方法中不精确以及不确定的方向与内容。他提出将计算分为两类:硬计算与软计算。自此,软计算的概念被广泛接受。主要内容包括人工神经网络、遗传算法、模糊逻辑等理论与方法。  

3.2.1 模糊逻辑