2024年第42周 AI服务器供应链动态周报
撰写日期:2024年10月21日
覆盖周期:2024.10.14 - 2024.10.20
核心标签:CoWoS扩产、HBM3e、液冷渗透、白盒化、交期波动
核心摘要
本周AI服务器供应链整体呈现“产能爬坡与结构性紧缺并存”的态势。一方面,台积电CoWoS先进封装产能按计划释放,英伟达H20系列在国内的交付周期出现松动迹象;另一方面,受下一代Blackwell架构量产前序调整影响,核心算力卡与HBM3e内存的供需错配依然严重。此外,随着单机柜功耗突破百千瓦,液冷散热组件(CDU/快接头)成为新的供应链卡点,而ODM直供模式对传统品牌商渠道的冲击正在加剧。
核心组件供需动态
1. GPU与先进封装:CoWoS产能释放,HBM仍是硬约束
- CoWoS产能爬坡:台积电本周确认其CoWoS月产能已提升至4万片以上,预计年底前达到5万片目标。受此利好,部分国内CSP客户反馈H20集群的交期从此前的16-20周微缩至12-16周,但优先级仍高度倾斜于头部云厂商。
- HBM3e供应吃紧:SK海力士HBM3e产能已被英伟达及AMD全线包揽,三星的HBM3e良率虽有所提升,但通过核心客户验证的进度仍慢于预期。HBM的紧缺直接导致高端8卡/8卡以上AI服务器整机排产受限,预计该状态将延续至2025年Q1。
2. 服务器平台与内存:MRDIMM蓄势,CXL初现端倪
- Intel/AMD平台切换:基于Granite Rapids的Intel至强6服务器主板本周进入大规模试产阶段,配合MRDIMM(多路复用双列直插内存模块)的内存带宽较上代提升显著,重点满足推理侧高并发需求。
- 存储行情:DDR5常规内存价格本周趋稳,但AI服务器专用的128GB/256GB高密度内存模组因需求旺盛,溢价区间维持在5%-8%。CXL内存扩展模块在部分头部互联网厂商的测试集群中开始小规模部署。
3. 网络与互联:Scale-up网络加速演进
- PCIe Gen5 Retimer:随着GPU集群规模扩大,PCIe Retimer芯片需求持续坚挺。国内PCIe交换芯片及Retimer国产替代方案本周取得进展,部分厂商样品进入实测阶段,有望在Q4末实现小批量出货。
- 高速光模块:400G SR4与800G SR8光模块出货量本周环比增长12%,主要受海外CSP巨头数据中心互联(DCI)带宽扩容驱动。硅光方案渗透率在800G节点稳步提升至30%左右。
散热与基础设施瓶颈
液冷组件进入“极度紧缺”预警
随着单柜功耗从40kW跃升至100kW+,冷板式液冷成为标配,但供应链出现严重错配:
- CDU(冷量分配单元):核心水泵与温控阀门主要依赖欧洲及日本供应商,交期已拉长至20周以上。国内二级供应商虽能提供整机,但核心部件的缺货导致CDU整机交付存在20%左右的缺口。
- UQD(快接头):本周市场预警,液冷快接头(尤其是不漏液型高规格型号)出现严重短缺。由于快接头良率要求极高,现有产能无法匹配机柜级液冷整机的组装速度,部分ODM厂被迫调整产线节奏。
渠道与市场观察
1. 交期与价格波动
- 整机交期分化:风冷架构的H20服务器因散热组件充足,交期缩短;但同等算力下的液冷机型因CDU/快接头卡脖子,交期反而拉长2-4周。
- 白盒化冲击:国内头部CSP increasingly 采用ODM直供(白盒)模式,绕过传统品牌服务器厂商。本周部分渠道商反馈,传统品牌商的AI服务器库存周转天数上升,被迫通过让利通用型GPU服务器来维持现金流。
2. 地缘政治与产能转移
- 东南亚产能转移加速:受地缘合规要求,本周多家头部ODM厂商宣布加大在越南、马来西亚等地的AI服务器主板SMT产线投资,预计Q4东南亚产能将占全球AI服务器代工出货量的15%以上。
短期展望与策略建议
- 对于CSP及终端客户:针对Q4及明年初的Blackwell架构导入期,建议提前锁定HBM及液冷组件产能。在合同中明确CDU及快接头的交期违约责任,避免“有卡无机”的尴尬。
- 对于渠道分销商:传统通用服务器利润空间被进一步压缩,建议将业务重心转向“AI算力租赁”或“液冷机房改造”等增值服务,从单纯卖硬件向提供AI基础设施解决方案转型。
- 对于运维团队:高密度液冷集群的大规模上线对机房运维提出全新挑战,需尽快建立针对漏液监控、盲插拔故障及CDU冗余切换的标准SOP,防患于未然。
免责声明:本报告数据基于公开信息与行业调研综合整理,仅供技术决策与渠道规划参考,不构成投资建议。