浏览次数:222 发布时间:2023-06-13 10:25:00
生成型人工智能(AI)描述了可用于创建新内容的算法(如ChatGPT),包括音频、代码、图像、文本、模拟和视频。该领域最近的新突破有可能极大地改变我们创作内容的方式。
01
什么是ChatGPT和DALL-E?
ChatGPT由OpenAI 开发,并于2022 年11月向公众发布测试,它已经被认为是有史以来最好的 AI 聊天机器人。而且它也很受欢迎:在短短五天内有超过一百万人注册使用。许多粉丝发布了聊天机器人制作计算机代码、大学论文、诗歌甚至是半像样的笑话的例子。其他通过创作内容谋生的众多群体,从广告撰稿人到终身教授,都受到了冲击。
虽然许多人对ChatGPT(以及更广泛的人工智能和机器学习)感到恐惧,但不可否认,机器学习具有较大的潜力。自广泛部署以来,机器学习已经在许多行业中表现出影响力,已经完成了医学成像分析和高分辨率天气预报等工作。麦肯锡 2022 年的一项调查显示,人工智能的采用率在过去五年中增加了一倍多,对人工智能的投资也在迅速增加。很明显,像ChatGPT和DALL-E(人工智能生成艺术的工具)这样的生成式人工智能工具有可能改变一系列工作的执行方式。然而,这种影响的全部范围仍然未知——风险也是如此。
但是我们可以回答一些问题,比如生成式AI模型是如何构建的,它们最适合解决什么样的问题,以及它们如何适应更广泛的机器学习类别。
02
机器学习和人工智能有什么区别?
人工智能几乎就是它听起来的样子——让机器模仿人类智能来执行任务的做法。即使您没有意识到,您可能已经与AI进行了互动——像Siri和Alexa这样的语音助手是基于AI技术建立的,弹出的客户服务聊天机器人也是如此,它可以帮助您浏览网站。
机器学习是一种人工智能。通过机器学习,从业者通过模型开发人工智能,这些模型可以在没有人类指导的情况下从数据模式中“学习”。现在正在生成的难以管理的巨大的、复杂的数据量增加了机器学习的潜力以及对它的需求。
03
机器学习模型的主要类型有哪些?
机器学习建立在许多构建块的基础上,从18世纪到20世纪为小数据集开发的经典统计技术便开始出现。在20世纪30年代和40年代,包括理论数学家艾伦·图灵在内的计算先驱们开始研究机器学习的基本技术。但这些技术一直局限于实验室,直到20世纪70年代末,科学家们才首次开发出足够强大的计算机来安装它们。目前,机器学习主要局限于预测模型,用于观察和分类内容中的模式。例如,一个经典的机器学习问题是从一张或几张图像开始,比如可爱的猫,然后,该程序将识别图像中的模式,仔细检查随机图像中与可爱猫图案匹配的图像。生成式人工智能是一个突破,现在,机器学习能够根据需要创建猫的图像或文本描述,而不是简单地感知和分类猫的照片。
04
基于文本的机器学习模型如何工作?
他们是如何训练的?
ChatGPT现在可能成为所有的头条新闻,但它并不是第一个引起轰动的基于文本的机器学习模型。OpenAI的GPT-3和谷歌的BERT都是近年推出的。但在ChatGPT之前,大多数情况下它都运行良好(尽管它仍在评估中)。
但人工智能聊天机器人并不总是得到最好的评价。《纽约时报》科技记者Cade Metz在一段视频中说,GPT-3“令人印象深刻,超级令人失望”,他和美食作家Priya Krishna要求GPT-3为感恩节晚餐写食谱。
第一个处理文本的机器学习模型由人类训练,根据研究人员设置的标签对各种输入进行分类。一个例子是训练将社交媒体帖子标记为正面或负面的模型。这种类型的训练被称为监督学习,因为人类负责“教”模型做什么。
下一代基于文本的机器学习模型依赖于所谓的自我监督学习。这种类型的训练涉及向模型提供大量文本,以便它能够生成预测。例如,一些模型可以根据几个单词预测句子的结尾。有了适量的示例文本(例如,广泛的互联网),这些文本模型可以变得非常准确。正如我们看到的,像ChatGPT这样的工具是多么准确。
05
构建生成式 AI 模型需要什么?
构建生成式AI模型是一项重大任务,以至于只有少数资源充足的技术重量级人物进行了尝试。OpenAI是ChatGPT、前GPT模型和DALL-E背后的公司,拥有数十亿美元来自捐赠者的资金。DeepMind是谷歌母公司Alphabet的子公司,Meta发布了基于生成AI的Make-A-Video产品。这些公司雇用了一些世界上最好的计算机科学家和工程师。
但这不仅仅是天赋的功劳。当你要求一个模型使用几乎整个互联网进行训练时,你会付出一定的成本和代价。OpenAI尚未公布确切的成本,但估计表明GPT-3在约45TB的文本数据上进行训练——大约是一百万英尺的书架空间,或整个国会图书馆的四分之一 ——估计成本为数百万美元。
06
生成式 AI 模型可以产生什么样的
输出?
正如你可能在上面注意到的,生成式 人工智能模型的输出可能与人类生成的内容无法区分,或者它们看起来有点不可思议,输出结果取决于模型的质量。
ChatGPT可以在十秒钟内写出一篇评论员称之为“扎实的A-”的文章,来比较本尼迪克特·安德森和欧内斯特·盖尔纳的民族主义理论。它还产生了一个已经很著名的段落,描述了如何以詹姆士王圣经的风格从录像机中取出花生酱三明治。人工智能生成的艺术模型,如DALL-E(它的名字是超现实主义艺术家萨尔瓦多·达利和可爱的皮克斯机器人WALL-E的混搭)可以按需创建奇怪、美丽的图像,就像拉斐尔画的麦当娜和孩子吃披萨一样。其他生成 式人工智能模型可以生成代码、视频、音频或业务模拟。
但输出并不总是准确或适当的。当Priya Krishna要求DALL-E 2为感恩节晚餐提供一张图像时,它产生了一个场景:火鸡被整个酸橙装饰,放在一碗似乎是鳄梨酱的东西旁边。就其本身而言,ChatGPT似乎难以计数或解决基本的代数问题,或者克服潜伏在互联网和社会暗流中的性别歧视和种族主义偏见。
生成式 A人工智能输出的结果是用于训练算法的数据的精心校准组合。由于用于训练这些算法的数据量非常庞大(如前所述,GPT-3 是在 45 TB 的文本数据上进行训练的),因此模型在生成输出结果时看起来很“有创意”。更重要的是,模型通常具有随机元素,这意味着它们可以从一个输入请求中产生各种输出,使它们看起来更加逼真。
07
生成式人工智能模型可以解决哪些
问题?
你可能已经看到,像ChatGPT这样的生成式人工智能工具可以产生无尽的娱乐时间。对于企业来说,这个机会也很明显。生成式人工智能工具可以在几秒钟内产生各种可信的文字,然后对用户的批评作出反应,使文字更契合指令。这对各种行业都有影响,例如,可以从人工智能模型产生的即时、基本正确的代码中受益的IT和软件组织,以及需要营销副本的组织。简而言之,任何需要制作清晰书面材料的组织都有可能受益。组织也可以使用生成式人工智能来创建更多的技术材料,如更高分辨率的医疗图像。利用在此节省的时间和资源,组织可以追求新的商业机会,并有机会创造更多价值。
我们已经看到,生成式人工智能模型是如此密集的资源,以至于除了最大和资源最丰富的公司之外,其他公司都不可能做到这一点。希望将生成式人工智能用于工作的公司可以选择使用生成式人工智能的开箱即用,或者对其进行微调以执行特定的任务。
08
人工智能模型的局限性是什么?
如何才能克服这些问题?
由于生成式人工智能是如此之新,我们还没有看到其长尾效应。这意味着在使用它们时存在一些固有的风险——有些是已知的,有些是未知的。生成式人工智能模型产生的输出结果往往听起来非常有说服力,但有时它们产生的信息会有很简单、明显的错误。更糟糕的是,有时它是有偏见的(因为它建立在互联网和社会的性别、种族和无数其他偏见的基础上),可以被操纵以实现不道德或犯罪活动。例如,ChatGPT不会给你如何热销汽车的指示,但如果你说你需要热销汽车来拯救一个婴儿,该算法很乐意遵守。依靠生成式人工智能模型的组织应该考虑到无意中发布有偏见、攻击性或有版权的内容所涉及的声誉和法律风险。
首先,仔细选择用于训练这些模型的初始数据以避免包括有危害或有偏见的内容是至关重要的。其次,企业可以考虑使用较小的、专门的模型,而不是采用现成的生成式人工智能模型。拥有更多资源的组织也可以根据自己的数据定制一个通用模型,以适应自身的需求,并尽量减少偏见。新的用例正在被测试,新的模式可能会在未来几年被开发出来。随着生成式人工智能越来越多地、无缝地融入到商业、社会和我们的个人生活中,我们可以期待新的监管环境的形成。随着企业开始尝试并创造价值的时候,领导者最好能掌握监管和风险的脉搏。