李开复:自主创新是中国人工智能大模型必经之路
添加时间:2023-06-07 点击次数:192
最近,随着人工智能(AI)2.0大模型的启动,我不仅跟同事热火朝天地研读相关论文,还去美国一线了解AI2.0的新趋势,探索这一领域产学研的深度融合。在人工智能大模型发展论坛上,我将近来关于AI2.0大模型方面的机遇与挑战及部分争议做一个比较通俗的分享和剖析。
大模型也会“胡说八道”
业内人士熟悉的AI1.0是以AlphaGo为代表的深度学习,随后AI1.0开始在计算机视觉等领域赶超人类,并且穿透实体行业创造了价值。但AI1.0也遇到了明显的瓶颈,这些瓶颈正好是AI2.0时代的大模型能够解决的。
AI1.0遇到的瓶颈是什么?在AI1.0时代,单领域数据集之间、数据集与模型之间各成孤岛。当时还没有大模型的时候,我们要做一个领域的AI应用,要深入该领域收集数据、清洗数据、标注数据,然后再去调整模型,整个过程的工作量和成本都非常可观。
AI2.0的大模型有一个很大的特点,就是可以用海量数据训练一个大模型,只需要微调就可以执行五花八门的任务。现在用来训练大模型的主要是文字数据内容,未来还会增加多模态数据,随着数据的丰富化,再以这个模型去做微调。可以预想,AI2.0的未来将具备非常大的威力。
一个聪明的AI引擎有望带来应用的爆发,那么这样的应用到底多快才能爆发?
前提还需要弄清楚一个重要问题,就是今天的大模型有时候会一本正经地“胡说八道”,但大模型的能力也来自这个所谓的“胡说八道”。如果将其“胡说八道”的能力降为零,那么其推理能力也几乎没有了。
因此,我认为内容生产、娱乐等是AI2.0最快也最易于落地应用的领域,这些领域有一定的容错空间,也能通过人工干预校准错误。未来,随着AI2.0的不断迭代发展,“胡说八道”的问题也有望解决。
不只是一个问答引擎
在此,我将AI2.0的大模型生态划分为基础模型层、中间层、应用层3个层次。
基础模型层主流的说法是模型即服务;应用层包括AI各种垂类应用,如辅助写稿、画图、抠图等;中间层则是提供模型微调、推理迁移学习的各种工具,帮助大模型更高效实践,让应用开发的成本降到最低,助推AI2.0应用进入百花齐放的态势,形成强大且有黏性的平台生态。
由此可见,AI2.0将是一个巨大的平台机遇,其规模将是移动互联网的10倍,所有的应用和界面都会被重写一遍,将颠覆很多行业。
未来,我们可以想象这样一个场景:一个很厉害的编辑可以通过AI写出一篇深度报道;创作游戏时,角色、背景、道具、衣服、故事的产生,甚至所有的代码最终都会用AI来写。一些小朋友甚至会把自己想玩的游戏通过AI写出来,再用文字做一个游戏介绍,几秒钟后就可以玩了,这跟今天的游戏制作有很大差别。
因此,大模型不只是一个问答引擎,它还将深刻改变未来应用的生态,可以成为人们的垂类智能助理,但也随之带来一些问题和挑战。因此,开发AI2.0时,需要同时研究如何善用AI2.0技术,以及制定管理AI2.0的法律、法规。
优秀的技术产品是“赛马”赛出来的
不难发现,除了AI领域外,大模型的改革还会带来一些平台式的巨大差距。
另外,在所有的应用里,AI-First(人工智能优先)将是最重要的应用。AI-First指这个应用没有AI就不能成立。简单地说,当我们把大模型从应用中抽掉,这个应用将会完全瘫痪。
要在AI领域做应用或创业,就一定要做必须有AI参与的App应用,因为它将是AI2.0时代的宠儿,它的整个用户体验将令人耳目一新。
近期,关于大模型有几种质疑的声音:“使用海外的开源大模型就可以做出中国版OpenAI”“大模型耗钱且耗人,只有巨头才有入场券”“开发小模型就够用了”……
这些说法正确吗?
首先,开源是非常重要的,中国技术未来的发展肯定需要开源,因为高校和创业者没有开源就很难得到启动的力量。但是,“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的。虽然开源模型本身有一定局限性,但如果直接使用海外的开源大模型,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。
第二,很多人做开源大模型训练时用GPT-4.0来训练,但谁也不敢保证GPT-4.0未来仍会让每个人都能使用,从商业的角度也没有理由让你占这个便宜。
第三,拿海外训练出来的大模型,在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同,所以自主创新做大模型是中国企业的必经之路。
当然,未来不可能有50家大模型公司存在,会收敛到一个很小的数字上。不过,在当前大模型这个领域,我们都在追赶,可以鼓励以各种不同的模式去先行先试,优秀的技术产品是“赛马”赛出来的。
AI2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面“赛马”。创业公司与巨头各擅胜场,正如ChatGPT背后的OpenAI公司一样,创业公司更灵活、更专业。从硅谷经验来看,很多技术创新的发起者,都技术领先、策略灵活、市场反应快。落地执行力强的团队将是中国大模型公司成功的关键。
创新需要合作,开放共创未来。我们期待中国大模型赛道能形成巨头、中小微创新企业一起发展的“创新综合体”,一起把AI2.0做大做强。