郑纬民院士谈AL算力的重要价值

添加时间:2023-05-11 点击次数:265

   AI算力是算力基础设施的重要组成部分,是新基建和国家“东数西算”工程的关键任务抓手。

     人工智能计算在海量数据、实时响应、极端条件等场景下相较通用计算优势愈发明显。预计到2025年,我国人工智能算力总量将超过1800EFlops,AI算力占整个算力的比重超过85%。

“以后的计算机中AI计算机和处理人工智能的计算机将占很大比例,特别是随着ChatGPT的发展,算力需求大幅提升,迎来了高速扩张时代。”。

   大家知道:AI计算与HPC(高性能计算)的区别是:HPC通常应用在天气预报、核聚变模拟、飞行器设计等领域,而AI计算是做分类、回归、自然语言处理等,二者应用场合不同,运算精度也不一样。

所以我认为AI算力基础设施的设计需要遵循计算平衡、网络平衡、IO子系统平衡的原则。

“传统的高性能计算机的测试结果与人工智能需要的性能不完全一致。高性能计算算力测试程序主要使用双精度浮点数运算,即64位浮点运算,人工智能训练以单精度浮点数,即32位浮点数为主。”如果要做符合语言模型的训练,就要考虑半精度平衡性,即设计中主要考虑半精度运营性能,又要注意双精度运算能力不能过低,所以双精度与半精度运算性能之比为1:100较好。

“现在很多厂家都已经在考虑这三个平衡设计,国内也有差不多30个城市在建或者建好了AI超算中心。”

    我个人预测,HPC+AI+大数据中心在未来不超过5年的时间内将会融合到一台计算机中,“既可以做HPC,又可以做AI,也能处理大数据”。