目前,人工智能超级计算机的发展势头迅猛;鉴于这一发展态势,人们普遍预计,到2030年,最前沿的人工智能超级计算机将呈现哪些特点?这一话题无疑引发了广泛的兴趣和诸多猜测。
数据追踪分析
Epoch AI收集了2019年至2025年间的500台AI超级计算机数据,对这些数据进行了详尽的分析,涵盖了性能、能耗、硬件成本等多个维度。同时,研究团队还深入探讨了AI超级计算机的所有权以及全球分布等关键趋势。他们追踪了35个国家中装备有专用AI芯片的集群,发现这些集群的计算能力已占全球总计算能力的约15%。这些研究成果为对AI超级计算机未来发展趋势的精确预测提供了稳固的数据支撑。
计算性能增长
自2019年度开始,该系列AI超级计算机在计算性能方面实现了显著提升,其年度增长速度达到了2.5倍。一方面,顶级AI超算机构使用的芯片数量正急剧上升,以2019年1月的橡树岭国家实验室Summit系统为例,该系统配备了27,648块V100芯片,而到了2025年3月,xAI公司的「Colossus」系统则集成了超过20万块H100和H200芯片;另一方面,这些顶级AI超算的单芯片计算能力同样以每年约1.6倍的速度增长,这一成就主要得益于它们广泛采用了最前沿的AI芯片技术。
训练任务适配
在最大规模训练任务中,年度增长率达到了4至5倍的高度,与此同时,AI超级计算机的进步也显现出类似的增长趋势。2024年,Sevilla与Roldan的研究揭示,从2018年到2024年,最大的AI模型对训练算力的需求每年正以4.2倍的速率迅猛增长。在2019年至2025年这段时间内,工业界采用的规模最大的AI超级计算机展现出超过最大AI训练任务所需算力的十倍性能优势。此外,该超算的发展趋势始终与AI训练任务相吻合。
算力对比趋势
尽管最大训练任务所需的系统规模增长达到了3.4倍,这一增速仅略超领先AI超算增速的3.0倍,然而,从统计学角度来看,这两种增速之间的差异并不明显——其p值仅为0.18。这一研究结果揭示了AI超算的进步与训练所需算力的增长呈现出同步的趋势。
能耗问题凸显
AI领域的高端超级计算机所采用的芯片数量有所增加,这一变化进而使得其能耗水平有所上升。与此同时,训练更高级别的模型对电力的需求也明显增强。以2019年1月橡树岭国家实验室的Summit超级计算机为例,其能耗达到了13兆瓦的峰值。2019年至2025年间,AI超级计算机的能源效率以每年约1.34倍的速率提升;即便计算性能保持不变,每年的能源消耗量亦约降低25%。
能效提升因素
AI超级计算机在能源效率上的提高主要源于两个重要的领域,然而,文章并未对这些推动因素进行详尽的探讨。展望未来,随着性能的持续增强,降低能源消耗将成为AI超级计算机发展的主要目标,这一发展动向与全球范围内推广的绿色计算理念相吻合。
这一趋势持续演进,至2030年,尖端的人工智能超级计算机将呈现出何等卓越的表现?公众对此有何见解?欢迎在评论区分享您的看法,并对本文给予点赞及转发支持!