“过去一台AI服务器装四张显卡,现在客户要的都是能装八张甚至十张显卡的高端设备。”12月18日,在2023AITechDay暨首届人工智能生态发展峰会现场,服务器厂商正展示全新升级的AI大模型服务器。中国证券报记者在现场了解到,AI大模型迭代速度越来越快,厂商对智能算力投入大幅增加,支持存储和训练的高端AI服务器的需求激增。不少AI服务器厂商今年订单都集中在高端AI服务器上。
业内人士表示,随着AI大模型加速迭代,智能算力已成为稀缺资源。未来较长一段时间内,我国AI服务器市场维持供不应求状态,国产AI芯片市场规模增长迎来关键窗口期。
当前,大模型厂商产品迭代如火如荼。据百川智能创始人、CEO王小川介绍,目前百川大模型保持每个月一次模型数据的迭代。
AI大模型正带动AI服务器算力需求持续扩张。安擎计算机相关负责人告诉记者,2023年,由于行业投资趋于谨慎,判别式AI应用场景收缩,AI服务器市场整体销售台数同比有所下降,但订单金额同比将会呈现增长态势。这是由于AI大模型算力需求集中爆发,成为智能算力的最大需求方。
“AI大模型厂商都在加快迭代速度,客户根本等不起你去建机房,而是希望拎包入住。”鸿博股份副总裁、英博数科CEO周韡韡告诉记者,“我们现在都是找一些已经建好的机房,然后把设备放进去,快速组网,调试好后交付给客户。AI大模型的发展让人看到的不仅是效率提升,似乎全行业迭代周期都在缩短。”
高端AI服务器设备十分紧俏。“大模型训练所需数据激增,AI大模型厂商需要的是能够支持存储和训练的高端AI服务器。因此各服务器厂商目前都在升级芯片规格、扩大卡组数量,向高端AI服务器方向升级。”上述安擎计算机相关负责人称。
我国智能算力资源稀缺。艾瑞咨询发布的《2023年中国智能计算中心行业发展白皮书》显示,2022年,中国智能算力规模占全部算力的比重为22%;从服务器结构来看,2022年,我国通用服务器占服务器总量比重为93.2%,而AI服务器仅占服务器总量的6.8%。多位业内人士表示,未来较长一段时间内,我国AI服务器市场维持供不应求状态。
随着AI大模型算力需求强劲,今年以来,国内算力产业链公司接连斩获新订单。
12月4日,鸿博股份公告称,子公司英博数科向百川智能提供一定规模的英伟达智算服务器,及其所有的算力资源以及配套软件应用和技术服务,涉及交易总金额预计达313.82亿元。据周韡韡介绍,截至2023年12月,英博数科累计签约额超18亿元。
公开资料显示,神州数码在10月29日至11月19日期间共签订四笔销售神州鲲泰品牌昇腾AI服务器订单,合同总金额达6.24亿元。
青云科技10月15日公告称,公司向高新兴讯美科技股份有限公司采购6.84亿元GPU服务器(含配套产品),并与客户签订6.90亿元销售合同AI设备,向其销售上述GPU服务器(含配套产品)。
在AI大模型浪潮的带动下,人工智能芯片、服务器、数据中心市场规模将显著提升。IDC预计,2023年中国人工智能芯片出货量将达到133.5万片,同比增长22.5%。
人工智能服务器方面,IDC预计,2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%;2027年将达到134亿美元,年均复合增长率为21.8%。
智算中心建设步伐加快。据不完全统计,截至2023年8月,全国已有超过30个城市建设智算中心。
中信证券表示,AI的持续发展拉动智能算力需求和建设水平提升,为光模块、服务器等领域带来持续增长机会。
AI大模型时代,进口品牌GPU等高端芯片供应面临周期波动挑战,为国产AI芯片加速推向市场打开关键窗口。不过,AI大模型的训练、推理和海量数据存储无一不需要高性能算力支撑,也对国产算力底层基础设施能力和生态建设提出考验。
艾瑞咨询产业数字化研究院负责人徐樊磊表示,在AI大模型爆发之前,国内的智能算力资源主要用于推理端。AI大模型趋势到来,使国内厂商开始推出训练端的算力硬件产品和服务,但目前相关产品能力比起全球领先算力能力仍有较大差距。
业内人士表示,在计算层面,由于芯片厂商在开发过程中使用的技术路线不同,导致芯片适配服务器等设备的开发周期普遍很长。在训练层面,单芯片算力有限,而大模型训练需要大规模的算力集群,需要算力系统具有灵活的算力扩展能力。在存储层面,多模态大模型的训练和推理对存储提出了更高要求。
近年来,我国AI算力市场高度依赖英伟达GPU硬件和相应的软件生态。周韡韡坦言,全球90%的AI工程师都在使用英伟达GPU配套的CUDA软件生态,这和英伟达GPU在全球的垄断地位完全匹配。“一些国产GPU计算性能并非绝对不够,而是若要把国产GPU和基于CUDA架构开发的设备进行适配,需要在调试和优化上花费大量精力,导致用户使用算力的效率下降。”
记者梳理发现,浪潮信息、海光信息、希姆计算、中科通量、瀚博半导体、墨芯人工智能、摩尔线程、天数智芯、寒武纪、燧原科技等芯片公司推出了应用于不同场景的AI推理和训练任务的芯片加速卡,涉及CPU、GPU、RISC-V等不同设计架构。
海光信息表示,海光DCU兼容CUDA生态,对文心一言等大多数国内外主流大模型适配良好。依托DCU可以实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型全面应用。
如何进一步提升国产AI芯片竞争力?中国工程院院士、清华大学教授郑纬民认为,要开发基于国产AI芯片的系统,这一过程中最重要的是做好生态建设。“国产AI芯片只要达到国外芯片60%的性能,如果生态做好了,客户也会满意。”郑纬民称。
徐樊磊建议,做好自主创新要从人才、设施、科研和生态领域四方面突破,逐步提升智能算力设备软硬件功能。在硬件方面,提高国产AI芯片的稳定性和兼容性,特别是提升芯片之间、服务器集群之间的数据传输效果。在软件生态方面,降低适配门槛,让开发者逐渐使用国产芯片生态。
中证网声明:凡本网注明“来源:中国证券报·中证网”的所有作品,版权均属于中国证券报、中证网。中国证券报·中证网与作品作者联合声明,任何组织未经中国证券报、中证网以及作者书面授权不得转载、摘编或利用其它方式使用上述作品。
网传万达商管新投资人以境外为主,原有部分境内投资人将退出?接近万达人士回应
珠海派诺科技股份有限公司向不特定合格投资者公开发行股票并在北交所上市网上路演