核心导读
本周AI服务器供应链呈现“冰火两重天”的态势:一方面,NVIDIA Blackwell架构芯片(B200/GB200)的备货指令下达,代工及封装产能争夺进入白热化;另一方面,中国区特供版H20芯片面临价格倒挂与需求疲软,渠道库存承压。此外,HBM3e产能瓶颈短期无解,液冷散热组件因功率密度飙升出现结构性缺货。以下是本周供应链核心动态深度解析。
1. 全球市场:B200/GB200引爆CoWoS产能争夺
本周NVIDIA向核心ODM及CSP客户下发了Blackwell架构GPU的量产预期指引。由于B200采用双Die设计,对台积电CoWoS-L先进封装产能的消耗量是H100的近两倍。供应链传出台积电正紧急调配设备,计划将CoWoS月产能提升至4万片以上,但Q3的产能配额已被头部云厂商(如Meta、微软)提前锁定,中小型客户拿到整机交付的时间可能延迟至2025年Q1。
2. 中国区市场:H20渠道价格倒挂,需求端疲软
受国内大模型厂商算力架构向国产化迁移趋势影响,本周国内渠道H20服务器的现货交易趋于冷淡。部分渠道商为回笼资金,出现低于拿货价的“抛售”行为,H20芯片溢价已从年初的50%回落至10%以内。运维端需注意,当前H20服务器在集群组网时,因PCIe通道数限制导致的通信开销问题,正在影响部分企业的采购决策。
1. HBM3e产能吃紧,SK海力士独占鳌头
本周供应链证实,搭配B200的HBM3e(12层堆叠)良率仍处于爬坡期。SK海力士作为NVIDIA核心供应商,其HBM3e产能已排至年底;美光虽已通过验证,但实际放量需待Q3末。对于服务器制造商而言,HBM的短缺直接制约了AI服务器整机的出货节奏,导致“有芯无内存”的组装延迟频发。
2. 800G光模块与PCIe Switch供需错配
在万卡集群建设中,网络拥塞成为算力放大的阿喀琉斯之踵。本周800G光模块(特别是SR8和DR8方案)的交付周期依然长达16-20周。同时,由于GPU基板设计复杂度飙升,PCIe Gen5 Switch芯片(如Astera Labs方案)需求激增,出现阶段性缺货,直接影响了8卡/9卡拓扑结构服务器的主板贴片进度。
1. ODM产能爬坡,GB200机柜重构供应链
富士康、广达等头部ODM本周均在调整产线以适应GB200 NVL72机柜的全新组装要求。GB200采用的铜缆背板连接方案对线缆弯折度、信号完整性要求极高,目前良率尚不稳定。此外,机柜重量超3000磅,对数据中心地板承重及运维搬运提出了前所未有的挑战。
2. 液冷组件结构性缺货,冷板与CDU告急
随着单机柜功率逼近100kW,冷板式液冷(DLC)已成高端AI服务器唯一选项。本周供应链反馈,由于快接头及冷板微通道加工精度要求极高,部分冷板供应商良率不足60%,导致交货延期。更严重的是,冷量分配单元(CDU)的交付周期已从8周延长至14周,成为除GPU外制约AI服务器交付的第二大瓶颈。运维团队需提前介入,评估机房CDU冗余与管路匹配度。
1. 算力租赁价格回落,中小集成商承压
受H20现货泛滥及国产算力(如腾910B)上云速度加快影响,国内8卡H20算力租赁价格本周跌破2元/卡时,部分中小算力中心面临“空置率上升+还贷压力”的双重打击。渠道集成商正从单纯的“搬箱子”向提供集群调试、分布式训练运维等增值服务转型。
2. 白牌蚕食品牌份额,交付能力成决胜点
在CSP大客户市场,广达、纬创等白牌ODM凭借贴近NVIDIA的先发优势,继续挤压传统品牌服务器厂商(如戴尔、联想、新华三)的份额。但在企业级市场,由于AI集群极其依赖售后与全栈调优能力,品牌商凭借“硬件+软件+服务”的一体化交付,仍掌握着议价权。
本周报数据来源于产业链上下游交叉验证,不构成投资建议,仅供IT与运维决策参考。