AI大模型工业应用现状、模式与展望

添加时间:2023-12-29 点击次数:484

2023年12月22日,首届“通智杯”人工智能创新应用大赛期间,通用人工智能与工业融合创新中心编制的《AI大模型工业应用现状、模式与展望》正式发布。

以下为主要内容。

一、背景与意义


党中央、国务院高度重视人工智能发展,习近平总书记指出,人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。今年4月,中央政治局会议强调,要重视通用人工智能发展,营造创新生态,重视防范风险。刚刚结束的中央经济工作会议再次强调,要大力推进新型工业化,发展数字经济,加快推动人工智能发展。

通用人工智能大模型(以下简称“大模型”)作为人工智能从专用化迈向通用化的发展新阶段,是集智能感知、智能分析、智能决策、智能执行等功能于一体的泛在智能技术,通过数据、算力、算法三要素深度融合,实现生产要素优化配置。

从生产结构来看,人工智能技术已成为现代工业生产的核心组成部分,能够大幅提高生产效率、优化资源配置、降低生产成本,为新型工业化发展提供强大的技术支持和动力。通用人工智能与制造业深度融合,可以进一步加速工业体系向高端化、智能化、绿色化迈进。为贯彻落实党中央国务院决策部署,推动新一代信息技术加速赋能新型工业化,中国工业互联网研究院筹备组建了通用人工智能与工业融合创新中心,深度聚焦大模型底座、架构、标准和应用等方面,开展了系列专题调研,总结并展望大模型在工业场景中七类可复制可推广的应用新模式,为大模型向制造业纵深拓展提供参考依据。

二、大模型及其工业应用发展总体情况


一方面,全球范围掀起大模型发展浪潮。大模型的出现将人工智能推向新的发展阶段,国内外龙头企业成为大模型角力的技术高地。AI大模型是具有大规模参数和复杂结构的人工智能模型,随着模型增大、训练数据量增多以及计算能力提升,AI大模型在自然语言处理、图像识别、语音识别和多模态识别领域取得了重要突破,自2020年以来,大模型在全球范围内市场规模迅速增长,迎来爆发期。根据Precedence Research测算,预计到2023年底,全球大模型市场规模将达到137亿美元,2032年大模型市场规模将达到1181亿美元。国外方面,OpenAI作为业界领先机构已发布语言类大模型ChatGPT(2022)和GPT-4(2023)、语音大模型Whisper(2022)、视觉大模型DALL-E(2021),微软将GPT-4相关能力整合入Windows 11系统、office365、Bing等重点产品形成Copilot系列应用;同时,谷歌推出多模态大模型Gemini(2023),Meta发布语言大模型LLaMA(2023),国外科技巨头纷纷加入大模型竞赛。国内方面,各科技企业亦积极跟进全球大模型发展趋势,百度发布语言大模型“文心一言”、阿里发布语言大模型“通义千问”、科大讯飞发布语言大模型“星火认知”、百川智能发布“百川大模型”、智谱AI发布ChatGLM系列语言大模型、中科院发布跨模态大模型“紫东太初”。

另一方面,大模型向B端尤其是工业领域应用已成为行业共识。大模型已呈现出以基础大模型为技术底座,工业应用为切入点的发展趋势,工业大模型概念应运而生。基础大模型(Foundation Model)通过提升模型的参数量和结构通用性,融合和表达更多领域知识和模态知识,形成全知全能的通用模型。而工业大模型依托基础大模型的结构和知识,融合工业细分行业的数据和专家经验,形成垂直化、场景化、专业化的应用模型。工业大模型相对基础大模型具有参数量少、专业度高、落地性强等优势,可以为工业垂直领域的技术突破、产品创新、生产变革等提供低成本解决方案。


三、大模型工业应用七大模式


工业产品从全生命周期来看可以划分为研发、设计、仿真、生产、测试、运维、售后等环节,本报告针对各环节的特点和要素进行分析,并结合大模型自身的能力特征,初步提出以下大模型在工业领域的潜在应用模式。

模式一:原理化研发

大模型可以对产品的结构数据进行分析,从微观层面探究产品的构型和机理,并通过模型的涌现能力生成具有新结构、新特性的产品。

以药物研发为例,人工智能大模型可以通过分析大量的已知药物分子数据,从中找出最优的药物候选,并生成一个新的药物分子设计方案,从而大大缩短药物研发的时间和成本,提高药物研发的成功率。

靶点发现和药物结构设计。靶点发现是药物研发过程中的核心环节,其中靶点是药物在体内的作用结合位点,药物与靶点之间的关系可以类比于钥匙和配套的锁。传统的靶点发现需要做大量的科研工作,对靶点做大量的生物学假设,并设计一系列的实验进行验证,需要漫长的周期。而大模型通过分析已知的药物分子结构数据、药物分子与疾病相关性的知识图谱,从中找出与疾病靶点相互作用的分子特征,然后利用这些分子特征,自动地生成新的药物分子设计方案。

药物方案评估和优化。在生成若干药物分子设计方案后,模型可以在人工提示下,对生成的设计方案进行评估,筛选出最有前景的药物候选。同时可以通过药物分子的结构和性质,优化其药效和毒性,通过预测药物的代谢途径和药物浓度,优化药物的剂量和用药方案。

辅助临床实验设计。实验验证是药物研发中必不可少的环节,但是实验通常需要消耗大量的时间和资源。人工智能大模型可以帮助研究人员设计更有效的临床试验方案,例如预测药物的安全性和有效性,优化临床试验的样本规模和时间等。通过预测和筛选,减少实验的数量和复杂度,从而提高药物研发的效率和质量。

模式二:前瞻化设计

大模型可以生成创新性的产品设计方案,从而更好地辅助技术人员快速将设计构思和意图转化为具体实施方案。

以传统工业设计为例,大模型可以实现工程制图、设计方案的快速生成,并辅助进行布局优化、参数校核,大幅缩减工业设计耗时,提升产品研发效率。

数学建模和代码编写。在工业设计过程中,很多问题需要建立特定的数学模型进行分析求解,例如机械产品设计中常遇到诸如力学强度校核、尺寸优化、标准零件选型等问题,邀请专家专门分析和建模成本高。而大模型可以根据具体设计需求,在短时间内为这些问题提供参考方案,并自动生成相应的程序代码,指导进行具体的工业设计实践。

多样化设计方案生成。以CAD为例,现有的海量标准化素材库提供了大量工程制图、布局规划等数据,大模型可以利用这些数据,结合设计者的创意思路和特殊需求,生成多样化的设计方案,供设计者进行参考。另一方面,亦可对设计方案进行快速优化调整,帮助工程师以更快的速度和更少的错误率创建布局。

模式三:高效化仿真

大模型可以利用自身的生成能力提供符合设计需求的虚拟化仿真测试场景/环境,解决工业产品设计中测试数据量少、测试环境单一等问题,提升产品的可靠性。

以汽车制造为例,通过人工智能大模型来生成仿真测试环境,进行汽车碰撞模拟和安全性评估,可以大幅提升仿真的精度和效率,推动车辆设计和安全性能的提升。

多元化仿真场景生成。汽车企业在车辆实际测试、模拟实验中积累了大量的真实数据,包括车辆结构、碰撞数据以及材料特性等信息。大模型可以利用这些数据学习车辆结构、材料属性与碰撞响应之间的非线性关系,理解不同参数(如碰撞速度、角度、车辆构造等)对于碰撞响应的影响,并通过自身的涌现能力生成新的、多样化的碰撞场景。这有可以让车辆模型在不同情况下进行仿真预测,包括之前未经历过的情形,并弥补特殊场景中的数据缺失,提升汽车仿真测试的全面性和准确性。

参数优化与快速预测。传统的车辆碰撞仿真中,需要采用不同的参数组合进行多轮次测试,以获得最佳结果,而每次测试需要花费大量的时间进行人工调参。而大模型可以凭借零样本的知识分析能力,通过问答形式,对不同的参数组合,快速预测出碰撞响应情况。这有助于在短时间内找到最佳参数组合,以减少车辆设计和测试的周期。同时,它可以在考虑历史碰撞案例的基础上,提供新颖的设计建议,可能涉及材料选择、构造调整等方面的创新。

模式四:精细化检测

通过大模型的零样本学习能力,并结合AR/VR等虚拟现实技术,实现对产品质量缺陷、人员违规操作、零部件装配误差等多种工业场景的快速高效视觉检测。

以工业生产中的质量检测和安全监测等场景为例,通过外接视觉传感装置和简单的指令辅助,大模型可以根据需求对指定的区域、人员进行检测,快速发现异常信息,大幅降低人工查验、样本收集和模型训练等成本。

高效率工业质量检测。以PCB的瑕疵检测为例,通用视觉大模型可以凭借强泛化能力,在不依赖工厂样本数据和本地化微调训练的情况下,直接对PCB原始图像进行语义分割,再配合简单设置的规则及方法实现缺焊、连焊、针孔等各类瑕疵的识别,从而解决PCB样本数据获取困难、标注困难的实际问题,规避训练调参带来的高额成本,提升工业产品缺陷检测的效率。

智能化安全生产监管。在煤矿生产行业中,借助大模型的机器视觉识别技术,结合设备运行状态数据,识别危险区域人员进入、人员摔倒、截割部落地、敲帮问顶、钻孔深度、锚固剂使用数量、搅拌时间、二次紧固、锚索张拉等场景,实现掘进作业人工监管向自动监控的转变,提升掘进作业流程规范,提高煤矿生产的安全系数。

个性化检测场景扩展。结合语言大模型和视觉大模型,进行多模态感知和交互,扩展大模型在工业视觉检测中的应用范围,提升应用的灵活性。例如,在工业质检中,可以通过语音指令控制大模型实现对不同类型、不同区域、不同等级的缺陷检测,满足各类产品的检测需求。

模式五:智能化调控

在大型现代化产线中,需要对多个关键节点进行智能化调度和控制,以提升产线运行效率。人工智能大模型可以通过分析多样化的历史数据,更好地理解诸如生产需求、资源可用性、任务优先级等工业调度任务中的复杂关系,从而优化各节点的任务分配和调度,提高生产效率和灵活性。

以工业机器人为例,大模型可以对各类生产数据进行自动整合分析,从而对机器人进行快速的任务分配和动态任务调整,成为大型工业产线中的“神经中枢”。

复杂模式学习和任务快速分配。汽车制造等大规模的生产线上通常配置多台工业机器人,负责组装、焊接、涂装等子任务。人工智能大模型可以收集机器人的性能数据、工作站状态、生产计划等信息,并基于这些数据,学习机器人的技能、任务复杂性、工作站之间的转移时间等复杂信息,并预测不同机器人执行不同任务的效率。当新的任务到达时,模型可以快速决定分配给哪个机器人,以最大程度地减少任务等待时间和生产周期。

动态任务分配调整。大模型可以从历史数据中分析机器人的性能和效率,并根据不同任务的要求,动态调整任务分配策略。这有助于优化机器人的使用,确保它们在不同任务中都能发挥最佳作用。如果出现机器人故障、工作站故障或生产计划变更等情况,大模型可以快速响应并重新调整任务分配,以应对不可预见的情况。

运动控制代码生成。从工业机器人单体运动的层面来看,生产人员可以通过文本、语音等交互方式,根据不同的任务需求,通过大模型快速生成定制化的运动控制代码,以控制机器人执行不同的任务。例如,对大模型输入指令“请写一段PLC程序,控制机器人将零件从A点转移到B点”。这种基于大模型的运动控制指令生成模式可以大幅提升工业机器人的灵活度,实现柔性化的产线控制。

模式六:科学化运维

大模型可以通过自身强大的推理能力实现对生产过程中各类数据的分析、预测,从而提升智能化运维水平,完善生产管理机制。

以仓储管理为例,可以利用大模型的对供应链中各类别、各模态的数据进行管理和整合,提升货品信息流的运行效率,打造更便捷、更快速的工业产品供应链体系。

智能仓储管理。使用嵌入多模态大模型的机器人进行货架管理、库存管理和订单拣货等操作,可以通过大模型的强视觉泛化能力进行自主货架定位、库存管理和物品运输等操作,提升仓库的运营效率。同时,使用大模型对库存进行预测,并根据销售速度和库存周转率等因素制定补货策略,有助于及时补充库存,避免库存短缺影响销售,同时避免过度补货,以免造成库存积压和资金占用的问题。

高效数据管理。工业生产的供应链中会涉及大量的数据,如原材料数据、加工工艺数据、设备状态信息、环境信息、人员信息、物流信息等。大模型可以对不同格式、不同来源的数据进行快速整理、分类和分析,降低数据整理成本。同时这些分类整理后的数据可以用于大模型的进一步微调,实现数据和模型的良性互动。

模式七:定制化售后

大模型可以凭借在自然语言对话方面的巨大优势,使售后服务不再拘泥于固定的问答库,而与客户形成更加自然、流畅和有效的对话,从而帮助工业企业实现满足不同用户需求的定制化售后服务,从而进一步提升客户忠诚度和用户成长,拓展业务范围。

以机械设备售后为例,大模型可以结合多模态、数字人等技术,让客户通过自然语言描述设备故障或问题,系统能够准确理解并提供详细、个性化的解决方案。

多维度交互式售后服务。机械设备的操作及维护需要复杂的操作,传统基于知识库的客服系统无法给予用户精确的指导。利用大语言模型作为后端逻辑推理支撑、虚拟数字人作为前端交互形象,系统可以准确理解客户的需求,结合自身的知识储备和具体的问题,迅速给出详细的、针对性的解决方案。同时,还可以通过虚拟数字人的手势和语音交互,从更多维度辅助客户进行设备的操作,不仅提高了售后服务的效率,还为客户提供了更加直观和个性化的服务体验。

四、下一步发展建议


现阶段,受限于工业场景碎片化、计算资源不足、工业领域训练数据采集和整理困难、大模型安全性可靠性等问题,我国大模型与工业的融合应用还处于初级探索阶段,发展面临一定挑战。一是基础大模型仍占据应用市场的主体地位,还未能下沉到工业垂直领域形成专业化的工业大模型。二是当前大模型在工业生产中的应用分布较为零散,尚未形成标准化、体系化的大模型工业应用范式。三是从底层构建工业预训练大模型具有较高门槛,仅有少数头部企业有能力开展工业大模型的研发。针对上述问题,提出如下建议:

一是面向工业场景推进大模型技术攻关。梳理面向工业场景应用的大模型共性技术问题,聚焦安全性、可靠性、实时性等方面,鼓励专业领域的高校、企业、研究机构合作开展攻关,通过大模型工业数据集扩充、典型工业场景规则集构建、模型训练算法优化等方式,加强国内大模型的技术研发,推进大模型工业应用能力的提升。

二是构建规模化的大模型工业数据资源池。组织大模型供给侧和需求侧企业及研究机构,研制工业大模型训练数据规范和测试标准。依托国家工业互联网大数据中心等标准化平台,建立大模型工业语料库,形成工业数据的管理机制。通过资金补贴、税费减免、政策倾斜等措施,引导国内大中型制造业企业进行工业生产运行数据的开源共享,形成涵盖国内重点工业领域的数据资源池,为工业大模型的训练、测试提供数据保障。

三是完善大模型工业领域性能的评测机制。以国家权威机构为依托,协同各行业需求方,建立标准化的大模型工业知识问答测试集,保障评测效率和结果的可信度。同时应建立长效的大模型工业领域性能评测机制,周期性围绕大模型知识能力、稳定性、安全性等关键性能进行评估工作,并根据产业结构、数据要素分布的变化对评测指标进行动态调整,以促进大模型对新型工业化赋能的持续性。

四是推动大模型在工业领域典型应用的试点示范。整合碎片化的工业场景,提炼出以产品辅助设计、精细化质量检测、智能供应链管理等为代表的大模型工业应用典型业务场景,明确各场景对大模型的量化需求指标,并推动建立相关的行业标准。建立大模型供给侧与企业应用侧之间的双向交互机制,促进形成若干大模型研发与制造业协同发展的特色产业集群,并推动建设一批工业大模型的标杆性、示范性应用。