自去年开始,OpenAI、Anthropic、DeepSeek等公司陆续发布了推理模型及相关技术,这些举措标志着人工智能领域的一次重大变革正式开启。在这一发展过程中,关注的中心正逐渐从模型训练转向推理应用,同时,对芯片等技术的需求也在进行微调。
推理革命来袭
自去年开始,AI行业迎来了重大变革;OpenAI发布了O1推理模型;Anthropic公司推出了Computer Use的Agent功能;与此同时,DeepSeek也成功发布了R1推理模型。这些成果综合表明,一场以人工智能技术为核心的变革浪潮已然开启,其焦点已从模型训练转向推理应用,一个全新的AI时代正逐步降临。
这一变化并非随机出现,它标志着人工智能技术持续进步的必然趋势;同时,这一进步也为未来带来了新的挑战,产生了一系列亟待解决的复杂问题,例如芯片算力与实际需求之间的匹配问题等。
GPU瓶颈难题
在模型训练期间,GPU扮演着至关重要的角色。不过,在推理环节,其高昂的投入成本以及相对较高的能耗比,形成了阻碍AI技术广泛应用的瓶颈。多年来,企业和研究机构在GPU领域的投入十分巨大,这无疑给AI技术的推广带来了显著的经济压力。
以大型数据中心为依据,初期阶段需投入大量资金用于购买GPU设备,这导致购置成本显著上升;同时,随着使用年限的增长,能源消耗量亦急剧增加;这两方面因素叠加,明显对人工智能技术在更广泛领域的推广和应用构成了限制。
替代方案探索
在推理阶段,GPU的局限性受到了业界的广泛关注。针对这一问题,业界正在积极寻求新的替代或辅助GPU计算能力的方案。FPGA、ASIC等专用芯片,以及高效的算法和模型优化技术,成为了研究的焦点。众多企业正加大研发力度,力图研发出一种既能有效降低成本又能显著提高性能的解决方案。
部分初创企业专注于ASIC芯片的研发项目,旨在特定应用领域内以更低的成本满足人工智能推理的需求,预计在短期内,它们或许会对GPU市场的领导地位构成挑战。
算力需求转变
昔日,众多企业和研究机构对模型训练项目投入了巨大资金。然而,随着人工智能技术的持续发展,原本依赖强大算力的用户群体正逐步从高等教育机构和科研单位转向独立的软件服务商。华为辽宁产业发展与生态部总经理黄涛强调,在2022至2023年间,这种用户群体的转移趋势尤为明显。
Gartner公司的高级研究总监曾劭清指出,目前基础模型供应商的数量保持在一个相对稳定的规模。然而,支撑这些模型训练的计算能力增长却遭遇了一定的限制。与此同时,全球多地对于托管服务的需求不断上升,导致推理应用对计算能力的依赖性持续增强。据预测,在可预见的未来,推理计算的需求有望在市场上占据主导地位。
芯片需求变化
AI技术的快速发展导致芯片市场面临显著变革。随着这一趋势的持续,图形处理器(GPU)已不再成为解决所有人工智能问题的独占手段。根据曾劭清的预测,预计到2027年,AI推理所使用的芯片中,AI加速器的数量将有望超越GPU的销量。
在人工智能推理技术领域,尤其是在那些对能耗和成本有较高要求的特定应用场景中,图形处理单元的不足之处尤为突出。以谷歌的TPU为例,该设备专为矩阵运算而设计,其能效比已达到GPU的十倍。与此同时,谷歌的Gemini大模型在运行操作方面完全依赖于TPU v5p。
行业自研趋势
TrendForce集邦咨询的研究指出,北美四大云计算企业正加快步伐,致力于自主开发ASIC芯片。这一进程的加速,主要得益于AI服务器需求的增长。这些企业通常每隔一到两年就会发布新的升级版本。它们普遍认识到,掌握核心芯片技术对于降低成本和提高性能具有极其重要的意义。
该行业自主创新的潮流将加剧市场竞争的激烈程度,与此同时,这一趋势也将促进人工智能推理技术的持续进步。面向未来,市场格局有望因这些自主研发的芯片而迎来显著的变化。
业界广泛关注,关于未来在人工智能推理领域可能主导的芯片或技术类型,您有何高见?敬请于评论区发表您的看法。同时,别忘了为本文点赞,并广泛转发分享!