胡晓峰:从AlphaGo到GPT4,究竟颠覆了什么?

添加时间:2023-03-31 点击次数:360

从AlphaGo到GPT4,究竟颠覆了什么?


国防大学 胡晓峰

从2016年AlphaGo横空出世,到2022年ChatGPT和AIGC大火出圈,再到2023年初GPT4正式登台,扩展无界,迭代迅速,无不使人惊叹:难道具有颠覆性的通用人工智能真的要来了吗?虽然目前只是初露端倪,还不能完全说得清楚,但我们却可以思考一下,从AlphaGo到GPT4,它们究竟颠覆了什么?对于这个问题,不同的人可能会有不同的关注点,看法也会众说纷纭。但从认知角度来看,我觉得有以下几点值得探讨:

第一,颠覆了那种以为AI只能逼近而永远不会超越人类智能的认知偏见,机器智能完全可以走出一条与人类不同的智能发展之路。

AlphaGo的创始人哈萨比斯说,人类并非完美物种,凭什么就认为人的智能就是宇宙的最佳智能呢?人类只习惯于3维空间,而AI甚至可以达到12维。AlphaGo的深度增强学习、GPT4的大模型,从不同方面找到了超越人类智能的途径,就是证明。这就如同人类找到了替代行走的轮子,而并不是机器的双腿。“地球孕育了人类,但人类不会永远都待在襁褓里”,AI又何尝不是如此?《三体》的作者刘慈欣说:“想象力可能是人类唯一的优势”(2018),但ChatGPT及AIGC已经证明,看来机器这方面也不差。情感、智慧和意识,也许可能是人类仍有别于机器的最后高地,但也不敢保证未来永远不会丢失。

第二,颠覆了那种认为AI永远只能是人类工具的哲学偏见,GPT4第一次让我们有了它可能成为人类智能伙伴的真实感觉。

与GPT4的对话,最让我们惊讶的是,它确实真正“理解”了我们所问的问题,而无论我们怎么拐弯抹角。也许它的“理解”与人类的“理解”还有差距,但这也是本质性的进步。这使得我们无意中会把它当成了有意识的“人”或平等伙伴。这是以前使用“智能系统”从来没有过的感觉,因为那些“智能系统”还是更像人机接口更好的自动化工具。AI机器也需要成为那种“永不关机”“不断学习”的存在,否则它们也会落伍。作为平等伙伴,意味着它不仅可以增强我们的能力,得到我们的信任,成为我们不可或缺的助手或其他存在,但也可能会颠覆我们已有的学习、工作乃至生活方式,甚至使我们处于某种危险之中。这种“信任”能够维持多久,我们能否愿意接受机器的指挥,目前还很难定论。因此,对AI的伦理、风险和法律等问题的研究,必须马上提到议事日程。

第三,颠覆了那种认为AI永远无法具有人类创意的社会偏见,被机器智能首先取代的可能是“白领”而非通常认为的“蓝领”。

GPT+AICG的出现,第一次让我们领略了机器智能的创造性,无论问答、总结、计划等事务性工作,甚至编程、推理、证明等技巧性工作,还是绘画、摄影、编剧、写作等一般性艺术创作,都好得让我们惊掉下巴。我们过去以为很难的创意类工作反而可能先被机器所取代,而那些我们认为不足为奇的具有“手艺”(比如各种匠人)以及“身体天份”性质(比如顶级运动员)的工作,至少目前还比较保险。机器智能的运用,意味着我们今后会更少地犯战术、技术性错误,但在高层思维方面需要的人类创造力不是更少而只会更多,要求不是更低而只会更高。人类的比拼未来更多可能集中在所谓“天花板”顶级的创意、创造和“灵机一动”上。学会与AI共存为其写提示词,可能成为基本工作技能。一些新的职业也会产生出来,比如“AI训练师”。但脑力劳动效率大幅度提高,会导致大多数普通工作岗位被淘汰,因而可能产生出的所谓“无用阶级”,将成为未来社会的大问题。

第四,颠覆了那种以为大模型永远只会线性发展的理论偏见,证明了真的可以“大力出奇迹”,智能可以通过复杂系统形式涌现出来。

还原论思维让我们很多人总是线性思考,对智能的发展预测也是如此。且不知“多者异也”,智能确实可以在语言关系积累到很大规模后发生非线性涌现。“智能只能是涌现出来的”的断言,在自然语言大模型的实践中得到了证实。GPT4的惊艳效果,让我们还说它不过是“人类语言统计平均的模糊图像”的话失去了底气,而过去那些很多所谓的“智能”其实不过只是“技能”而已。当然“大力出奇迹”是建立在精巧算法以及极大算力和数据基础之上的,因而新一代算力和数据关键基础设施建设将会出现高潮,大模型不管是以“AI产业操作系统”还是“智力新电厂”哪种形态出现,都将成为各个领域竞争博弈的基础和利器。同时,作为AI发展的理念和智能算法的理论基础,复杂性科学未来将会在AI领域得到更多的重视。

第五,颠覆了那种以为自然语言模型只适合于语言类应用的技术偏见,GPT让我们理解了“语言是人类智能的核心载体”的真正含义。

过去我们大多数人以为“语言只是语言”,对语言的智能处理也大多都集中在识别、合成、翻译或简单会话上。其实,语言不仅是人类交流的形式和途径,更是人类智能的载体和工具。事实上,我们连思考都离不开语言的表达和帮助。GPT大模型,第一次将自然语言作为人类智能核心载体形式的理念,不仅成功地实现了与人类流畅的对话和交流,而且还成为了证明智能存在和表示的最佳形式,而非像过去那样仅仅通过下棋、游戏或计算等博弈的形式来证明。同时,它又作为智能的“基座”,把几乎所有的智能模态形式集合到了一起,从办公、绘画到编剧,甚至玩游戏、控制机器人,才创造出了当前的AI爆发的这个奇迹。我们这时才恍然大悟:语言才应该是人类智能的核心,AI的起点!

第六,颠覆了某些人认为我们AI研究已经处于全球前列的幻觉偏见,让我们再一次认清楚了与顶端研究在原创和基础上的差距。

原创和基础上的突破,一定源于对“第一性原理”的理解,以及对基础性研究的坚持,这不是多少篇论文数量所能代表的。AlphaGo的创造者DeepMind和GPT的创造者OpenAI,都坚信通用人工智能AGI可以实现,虽然两者的技术路线截然不同,但却都在不懈的坚持中取得了大进展。这与那些浅尝辄止、跟风起哄式的研究,是完全不在一个层次上的。所以我们要特别警惕所谓的“中等技术陷阱”(郑永年语),只愿“小成即安”,短期得利,不愿下大力气做长期努力去解决基础性问题,最后陷入钱花了不少,但却在差距上被越拉越大的窘境。何况今天美国人还拼命地在AI领域对我们不断进行打压。未来的竞争将集中在人才竞争上,而未来人才的比拼,不仅体现在理论、算法或工程上,而且更会体现在管理、投资或服务上。

最后,基于以上看法,我们是不是该对已有的AI研究框架重新进行思考,并制定出能够适应新形势的研究和发展计划,重新出发。

AlphaGo和GPT的出现影响了我们对AI的研究重点,但大模型的成功却冲击了AI的基础研究框架,造成了很大的颠覆性后果。尤其是认知决策类AI,更是首当其冲。我们不能只是想着“照葫芦画瓢”如何复刻一个AlphaGo或GPT,或者只是简单地在其上开发应用,而应该想一想这些颠覆对我们已经开始的研究会带来什么影响:哪些应该继续或扩大,哪些又应该果断停止,还有哪些需要完善或新设。尤其是要搞清楚我们研究AI的初心是什么。哈萨比斯说,他们追求通用AI的目的,就是要“先解决AI,然后用AI解决一切”。我们是不是也应该停下来想一想,我们在AI研究中到底追求的初心是什么?也是AGI吗?