核心摘要
本周AI服务器供应链延续“紧平衡”态势。核心算力芯片向下一代平台(B200/GB200)过渡的迹象初显,HBM3e产能仍是决定整机出货量的绝对瓶颈;网络侧,硅光与铜缆的路线之争愈演愈烈;散热方面,冷板式液冷渗透率加速攀升,供应链正经历从“按需定制”向“标准化量产”的关键转型。此外,区域性地缘政策变动仍在持续扰动渠道分销体系。
本周,核心算力芯片的交期依然呈现两极分化。一方面,面向海外CSP(云服务提供商)的H100/H200需求依然强劲,但新增订单已开始向下一代B200平台倾斜,部分ODM厂商已收到B200的早期测试样机(EVB),预计Q3末开启小批量试产。
另一方面,HBM(高带宽内存)的紧缺毫无缓解迹象。SK海力士作为当前HBM3e的主力供应商,其产能已被Nvidia全额锁定;三星与美光虽在加速验证导入,但良率爬坡尚需时日。受此影响,当前AI服务器整机出货的卡点已从GPU核心转移至HBM模块。国内市场方面,H20/L20等特供版芯片的渠道流转速度加快,由于算力密度要求,国内CSP与智算中心倾向于采用8卡或更高密度的集群配置,导致特供版GPU的配套主板(OAM基板)及高速连接器需求激增,交期拉长至8-10周。
随着万卡集群成为常态,网络互连正成为仅次于算力的第二成本中心。本周供应链动态显示,800G光模块已进入规模化交付阶段,单模SR8与双模DR8版本均有大量出货,主要流向海外头部云厂。同时,1.6T光模块的样品验证已在部分头部网络设备商内部启动。
值得关注的是,在Nvidia NVLink5.0及GB200架构的推动下,铜缆连接(DAC/AEC)在短距离互连中展现出极强的成本与功耗优势。本周国内多家线束及连接器厂商反馈,高速背板铜缆订单环比增长超30%。在机柜内部或相邻机柜间,铜缆凭借极低功耗和低延迟,正在“光进铜退”的大趋势下,于AI服务器集群内部实现“铜进光退”的局部逆势反弹。
单机柜功耗突破10kW乃至40kW后,风冷已彻底失效,液冷从“可选项”变为“必选项”。本周供应链最显著的变化是冷板式液冷(DLC)的快速标准化。以往冷板与分流管需根据不同GPU型号深度定制,如今为缩短交付周期,头部ODM正联合冷部件供应商推行“通用型冷板+标准化快接头”方案,以适配不同代际的AI服务器。
然而,液冷系统的核心组件CDU(冷量分配单元)正成为新的交付瓶颈。由于CDU涉及水泵、换热器与精密控制阀的深度集成,且需满足严苛的漏液检测标准,当前高端CDU的交期已拉长至12-14周。部分集成商反馈,冷板与管路虽已就绪,但因CDU缺货导致整机无法出厂的情况时有发生。此外,浸没式液冷虽然冷却效率更高,但受限于运维复杂度与TCO成本,本周渠道端反馈的新增订单占比不足15%,冷板式仍占据绝对主流。
渠道端本周暗流涌动。受地缘政策影响,亚太区域的高算力芯片合规审查力度空前加大。部分渠道分销商反映,特供版GPU的现货周转率下降,由于终端客户对合规审查的担忧,持币观望情绪加重。同时,为规避风险,部分国内智算中心开始转向“算力租赁”模式,而非直接采购裸金属服务器,这促使渠道商从“硬件搬砖”向“算力运营”转型。
在品牌格局上,白牌厂(ODM/OEM直供)与品牌厂(如Dell、Lenovo、Inspur)的份额博弈进入新阶段。海外CSP凭借极强的自研能力,更倾向于直接向广达、纬创等ODM采购定制化JDM服务器;而传统企业及国内地方智算中心,由于缺乏运维大规模集群的能力,更偏好采购品牌厂提供的一体化解决方案(含软硬件栈与维保)。本周供应链传出消息,多家品牌厂正在重构售后体系,将传统“4小时响应”升级为“GPU故障热替换与集群健康度监测”,以此作为核心竞争力对抗白牌侵蚀。