工信部组织开展2021年人工智能产业创新任务揭榜挂帅申报工作

添加时间:2021-11-15 点击次数:227

工业和信息化部印发通知,组织开展2021年人工智能产业创新任务揭榜工作。进一步探索完善揭榜挂帅机制,面向全社会张榜招贤,激发产业创新活力,遴选培育优势企业和成果,加速我国人工智能产业创新发展。揭榜工作重点面向3个方向:一是核心基础,包括高性能云端人工智能芯片、高性能边缘端/终端计算人工智能芯片、智能传感器、终端人工智能推断框架、人工智能开发服务平台及工具等5大项任务。二是智能产品,包括机器翻译系统、三维图像身份识别系统、智能语音交互系统、自动驾驶虚拟仿真测试平台、智能机器人、智能无人机、智能导盲产品、智能制造关键技术装备与系统、高精度工业视觉检测系统等9类产品。三是公共支撑,包括人工智能训练资源库、大规模预训练模型、人工智能安全检测平台等3类能力。工业和信息化部将与有关部门、地方及金融机构等加强协同,加大对揭榜优势单位的支持力度,通过政策引导、项目带动、试点示范等多种手段加速揭榜成果应用落地。

关于组织开展2021年人工智能产业创新任务揭榜挂帅申报工作的通知



工信厅科函〔2021〕231号


  为贯彻落实习近平总书记关于揭榜挂帅工作的重要指示精神,加快推动我国新一代人工智能产业创新发展,现组织开展2021年人工智能产业创新任务揭榜挂帅申报工作。有关事项通知如下:

任务内容

  揭榜挂帅工作聚焦人工智能产业发展的核心基础、重点产品、公共支撑等3类创新任务,发掘培育一批掌握关键核心技术、具备较强创新能力的优势单位,突破一批人工智能标志性技术产品,加速新技术、新产品落地应用。(任务详见附件)

推荐条件

  (一)揭榜申报主体包括从事人工智能技术创新和应用服务的相关企业、高校、科研院所等,应具备独立法人资格,具有较强技术创新和产业化应用能力。
  (二)各省、自治区、直辖市及计划单列市工业和信息化主管部门、中央企业集团、人工智能相关行业组织按照政府引导、企业自愿的原则,优先推荐创新能力突出、产业化前景好、行业带动作用明显的项目。
  (三)每个主体申报不超过3个项目。已列入前期揭榜优胜项目的不得重复申报。

工作要求

  (一)申报主体可通过申报系统(https://aibest.miit.gov.cn)进行申报,完成注册后填写申报所需材料。申报截止时间为2021年11月15日。
  (二)推荐单位于2021年11月30日前使用账号登录系统并确认推荐名单。各省、自治区、直辖市工业和信息化主管部门、人工智能相关行业组织推荐项目数量原则上不超过15个;计划单列市工业和信息化主管部门推荐项目数量原则上不超过5个;中央企业集团和部属单位不占属地指标,可直接报送,推荐项目数量原则上不超过3个。
  (三)工业和信息化部组织遴选并公布入围揭榜单位名单(每个揭榜方向原则上不超过5家)。入围揭榜单位完成攻关任务后(名单公布之日起不超过2年),工业和信息化部委托第三方专业机构开展测评工作,择优发布揭榜优胜单位名单(每个揭榜方向原则上不超过3家)。
  (四)请推荐单位高度重视人工智能产业创新任务揭榜挂帅工作,结合本地区、本领域实际,遵循公开、公平、公正的原则完成好推荐工作,并在政策、资金、资源配套等方面加大支持力度。
附件:2021年人工智能产业创新任务揭榜挂帅申报指南


附件:


2021年人工智能产业创新任务揭榜挂帅申报指南

一、核心基础


  (一)高性能云端人工智能芯片

  揭榜任务:研制高性能云端人工智能芯片,突破适用于人工智能计算范式的矩阵乘加内核架构、实现高速互联总线等核心技术,满足云计算环境中的低能耗训练和推断。在智慧城市、自动驾驶、云计算、智能家居等重点领域实现规模化商用。
  预期目标:到2023年,支持多种国内外主流深度学习框架,支持计算机视觉、自然语言处理、智能语音等技术领域中不少于三种主流神经网络模型的训练与推断。云端训练芯片可支持FP32、TF32、BF16、FP16、INT8等计算精度,算力可达到32TFLOPS@FP32、64TFLOPS@TF32、128TFLOPS@BF16、128TFLOPS@FP16、512TOPS@INT8,芯片典型功耗不高于400W。云端推断芯片支持FP32、TF32、FP16、INT8等计算精度,算力可达到32TFLOPS@FP32、128TFLOPS@TF32、128TFLOPS@FP16、256TOPS@INT8,芯片典型功耗不超过75W。
  (二)高性能边缘端/终端计算人工智能芯片  揭榜任务:面向机器学习边缘端及终端,研发高性能、低功耗、低延时、高算力性价比的人工智能芯片;研发配套的编译器、驱动软件、开发环境等产业化支持工具,形成加速卡、智能计算盒子、边缘服务器等完整的配套产品。
  预期目标:到2023年,支持多种国内外主流深度学习框架,支持计算机视觉、自然语言处理、智能语音等技术领域中不少于三种主流神经网络模型。边缘端芯片峰值性能不低于20TOPS@INT8,支持FP16、INT8、INT4等量化精度,芯片典型功耗不高于16W,能效比超过2TOPS/W @INT8。终端芯片能效比超过5TOPS/W@INT8,典型功耗不超过2W,支持INT8、INT4等量化精度。
  (三)智能传感器  揭榜任务:研发基于新需求、新材料、新工艺、新原理的智能传感器,提升图像、声学、健康监测、车规级雷达、车规级摄像头等智能传感器自主研发水平,推动智能传感器的产业化应用。
  预期目标:到2023年,相关类型传感器达到以下性能:声学传感器信噪比达到70dB、声学过载点达到135dB。柔性干式脑电电极、肌电电极、心电电极的导电性能显著提高,导电阻抗可以达到小于5KΩ。车规级固态激光雷达在自动驾驶场景下实现探测距离≥250m,水平视场角120°/垂直视场角20°,水平角度分辨率≤0.075°/垂直角度分辨率≤0.075°。车规级摄像头在自动驾驶场景下,前视、后视摄像头实现可探测距离>250m (FOV 30°),环视、侧视实现可探测距离>100m (FOV 180°)。其他类型传感器性能达到国际先进水平。
  (四)终端人工智能推断框架  揭榜任务:开发高性能终端人工智能推断框架,突破多模式训练、多精度推断、多平台覆盖、模型量化等关键技术,运行效率、量化能力、压缩率满足应用场景需求,实现自学习、自定义算子、分布式算力调度等能力。
  预期目标:到2023年,框架支持C、C++、Java和Python等主流开发语言中3种以上,适配5款以上人工智能推断芯片,支持FP32、FP16、INT8、INT4等多种推断精度,在自动驾驶、智能医疗装备、智能家居、智能终端等重点领域实现规模化商用。
  (五)人工智能开发服务平台及工具  揭榜任务:研制低门槛、高性能、可扩展的人工智能开发平台,突破智能数据标注、自动机器学习(AutoML)、大规模异构资源管理、云边端协同管理等核心技术,提供面向机器视觉、自然语言处理等特定应用和金融、制造、能源等典型行业的平台服务能力。

  预期目标:到2023年,平台支持主流人工智能深度学习框架,支持3种以上人工智能芯片的适配,支持多种典型算法和工具,多机多卡分布式环境下线性加速比达到国际先进水平。工具支持典型场景的智能化标注,标注工作量显著降低,实现典型行业的实际应用。在多个标准数据集上AutoML算法的性能与人类专家差距在10%以内。

二、智能产品



  (六)机器翻译系统  揭榜任务:突破低资源机器翻译模型架构、跨语言跨领域知识迁移、鲁棒性训练与解码、多语言通用翻译引擎等核心技术,开发高性能的小语种自动翻译模型与算法。在实时、非实时、常见噪声等多种应用场景下,支持语音转文本、语音转语音、文本转语音、文本转文本等能力。
  预期目标:到2023年,实现超大规模多语言通用机器翻译引擎,支持中文普通话、常见方言、外语类型的翻译,支持多个国产软硬件平台的小语种机器翻译训练与推断,小语种机器翻译抗噪音与领域迁移鲁棒性满足实际应用需求。系统的译文忠实度大于90%,译文流利度大于90%。
  (七)三维图像身份识别系统  揭榜任务:研发三维图像身份识别系统,包括3D成像硬件模组,千万大库3D人脸识别算法,云-边协同3D人脸识别引擎等关键技术,实现在人脸支付、智慧安检、视频监控、图像检索等典型场景的应用。
  预期目标:到2023年,高精度3D成像硬件模组1米距离成像精度达到1毫米,误识率小于0.001‱,拒识率小于5%。3D人脸识别引擎支持大库实时检索,QPS大于150,达到国际先进水平。在典型应用场景下,系统对二维静态纸质/非纸质图像、电子/动态图像、面具、头模拒绝率≥99.9%,人脸活体接受率≥99%。系统应用的安全合规性符合国家相关法规要求。
  (八)智能语音交互系统  揭榜任务:研究基于人机对话的智能语音交互系统,突破环境因素和用户口语发音差异等导致的语音识别技术瓶颈。研究多语种及多风格情感语音合成技术,实现自然、情感丰富的语音合成效果。研究以多模态识别技术为前端,基于多种机器学习方法的语义对话系统,提升开放场景下的语义泛化能力。研究智能语音分布式管理,实现多个智能交互设备的协同工作。在智能制造、智能客服、智能车载、智能家居等场景下实现大规模应用。
  预期目标:到2023年,实现多场景下中文语音识别平均准确率达到98%,远场识别率超过95%,语音合成MOS分不低于4.2分,误唤醒每24小时不超过1次,用户意图准确率达到95%以上,多设备协同唤醒准确率达到98%以上,支持的外语类型、少数民族语言、方言种类达到5种以上,支持个性化语音合成种类3种以上,平均响应时间小于2秒。 
  (九)自动驾驶虚拟仿真测试平台  揭榜任务:研制高置信度、高覆盖度、高精度的自动驾驶仿真测试验证平台,突破场景构建、车辆动力学建模、驾驶员建模、传感器建模等关键技术,提升自动驾驶系统功能测试和性能评价能力,验证自动驾驶系统是否符合应用功能要求和安全要求。
  预期目标:到2023年,基于高精度地图和三维重建技术构建场景库,建立自动驾驶仿真场景1000个以上,包括典型场景、连续场景、车路协同场景和城市道路场景。感知系统仿真实现激光雷达、毫米波雷达和摄像头仿真,能够接入自动驾驶感知和决策控制系统,实现道路环境场景仿真测试及量化评价,为行业企业提供有效的研发、产业化测试服务。
  (十)智能机器人  揭榜任务:重点围绕家庭服务、医疗健康、公共服务、养老服务、金融服务、巡检安监、智能物流等领域,突破包括多模态智能交互、多机协同及云平台、智能精准安全操控、感知信息融合、影像定位与导航等关键技术,推进智能机器人规模商用。
  预期目标:到2023年,面向不同应用场景,智能机器人具备以下一种或多种能力:在多模态交互能力方面,识别准确率在95%以上,在巡检等特定应用场景可实现对缺陷和隐患的全天候、全方位、全自主监测。在多机协同方面,具备高安全、高精度、超大作业范围协同能力,以及面向场景的智能化运维能力。在自主动作能力方面,具备自由移动与避障能力,在特定应用场景可实现安全可靠、智能决策的高自动化水平和高智能化水平的无人搬运能力。在智能知识库方面,拥有面向应用场景的规模化知识库,具备智能问答等功能。在健康护理服务方面,实现智能辅助诊断、身体指标检测、高清远程医疗等功能。
  (十一)智能无人机  揭榜任务:突破智能跟随、自主作业、群体协同作业等关键技术,推动5G通信、北斗导航、边缘计算等新技术在数据传输、链路控制、智能操作、监控管理等方面的应用。促进智能无人机在应急救援、通信保障、电力巡检、森林防控、采矿安监等危特场景的应用。
  预期目标:到2023年,智能无人机实现360°全向感知避障,避障模式下最大飞行速度不低于14m/s。新一代通信网络环境下,无人机远程高清图传屏到屏延时小于200ms,远程控制延时小于60ms。面向森林草原巡检、火灾预警和消防救援等应急场景应用无人机抗风七级,连续飞行时间不小于60分钟。人工智能飞行处理系统实现自动智能强制避让航空管制区域,产品达到国际先进水平。
  (十二)智能导盲产品  揭榜任务:围绕视障人群的无障碍独立出行需求,研制具有高性能、高精度、高度无障碍的导盲系统及产品,突破室内精准无障碍导航、室外复杂环境精准导盲、复杂场景下智能感知、自主决策、协同引导以及智能信息共享等关键技术,支持立体空间安全避障,提升路径学习、物品识别的自学习能力,进一步解决视障人群的出行问题。
  预期目标:到2023年,导盲产品利用5G、短距离通信和高精度卫星定位等技术,实现主动识别、主动判断、主动避障、主动引领、低时延快速响应,具备处理室内外各类复杂出行环境的能力,实现立体空间安全避障。通过语音、音效、震动等多种交互方式实现主动引领导盲功能,支持远程人工导盲服务。产品的续航时间、适用性、可靠性、安全性满足视障人群的出行需求。
  (十三)智能制造关键技术装备与系统  揭榜任务:突破智能装备自主识别、自主优化、自主学习、群体协同等关键技术,推动人工智能技术与智能制造装备融合。研发智能新型工业控制系统等创新产品,推进人工智能算法与工业自动化系统融合。研发智能工业软件,推进人工智能与研发设计、生产管控、经营管理等工业软件系统的融合与应用。
  预期目标:到2023年,智能装备具备环境感知、控制指令优化、自主学习、人机交互、协同组织功能,重复定位精度达到特定场景生产制造要求,具备5台以上单台装备的协同能力。智能工业控制系统涵盖10种以上人工智能算法模型。智能工业软件设计仿真领域形成不少于5类智能化功能模块,在生产管控、经营管理软件领域分别形成不少于20类智能化功能模块。在仓储物流、石油化工、服装纺织、轨道交通等主要工业领域实现集成应用。
  (十四)高精度工业视觉检测系统  揭榜任务:研制基于机器视觉、高精度传感等技术的工业视觉检测系统,推动视觉和人工智能技术结合的检测系统在精度、稳定性与检测速度等领域关键技术突破,实现视觉技术在测量、定位、检测、引导及识别等生产管理重点领域的场景创新与推广应用。
  预期目标:到2023年,3D视觉检测、小样本训练、多类型混合缺陷识别等关键技术实现重大突破,视觉检测系统的工业现场漏检率、误报率、测量精度、识别速度、系统一致性满足实际生产需求,实现产业规模化应用。

三、公共支撑



  (十五)人工智能训练资源库

  揭榜任务:建设通用基础训练资源库和行业训练资源库,可提供合规的、高质量人工智能训练资源库、标准测试数据和服务能力,具备多类型、多场景数据采集与处理服务能力。通用基础训练资源库支持计算机视觉、智能语音、自然语言处理等典型人工智能应用训练数据,行业训练资源库可提供定制化行业领域训练数据服务。
  预期目标:到2023年,通用基础训练资源库具备以下一种或多种数据类型:语音识别数据时长超过9万小时,标注准确率超过97%。图片数据量超过1500万张,标注准确率超过97%。视频数据时长超过800小时,标注准确率超过97%。自然语言处理数据量超过600万条,标注准确率超过97%。行业训练数据满足相关领域如工业、交通、金融等行业的应用需求。
  (十六)大规模预训练模型  揭榜任务:研发面向计算机视觉、自然语言处理、智能语音等人工智能核心技术的大规模预训练模型。突破预训练模型的训练算力、时间等限制,结合微调等技术,提升常见视觉、语言任务的分析和处理效果,搭建人工智能通用算法底座,提升大规模预训练模型的公共支撑能力。
  预期目标:到2023年,构建至少覆盖多语种文本、语音、图像、视频的多模态预训练大模型,模型参数至少达到千亿级。构建人工智能预训练大型模型的工程化开发能力,建设通用的人工智能开发工作流,减少专家干预及人为调参。平台具备提供数据、代码、模型、API等服务的能力,在工业、医疗、城市、金融、物流、科学研究等行业领域实现规模应用。
  (十七)人工智能安全检测平台  揭榜任务:研发人工智能数据安全测试平台,支持对模型数据泄露行为检测。研发人工智能算法安全性测评平台,支持针对以人脸识别身份认证、自动驾驶智能识别等为代表的人工智能系统进行抗对抗样本攻击能力等安全风险的测评。研发面向金融、政务、电商等行业领域的风险监测预警平台。
  预期目标:到2023年,人工智能安全检测平台具备以下一种或多种能力:不少于3种人工智能模型数据泄露行为检测方法。不少于10种数字世界黑盒对抗攻击、不少于2种物理世界黑盒对抗攻击算法。平台支持对TensorFlow、PyTorch等典型深度学习框架训练出的算法模型的安全性进行高效的、自动化的测评,支持测评多种任务模型的安全性,如包括人脸识别身份认证、自动驾驶智能感知等任务。风险监测预警平台具备至少10种行业监测预警模型,大幅提高行业风险监测有效率与运行安全性,行业风险监测覆盖率显著提升。