液冷设备供应商评测:算力狂飙下的“降温”博弈
随着AI大模型与高算力GPU(如NVIDIA H100/B200)的规模化部署,单机柜功率密度正以惊人速度突破50kW甚至向100kW演进。传统风冷已触及散热物理极限,液冷不仅是从“可选项”变成了“必选项”,更是决定数据中心TCO(总拥有成本)与PUE的核心变量。
然而,液冷并非简单的水冷,它涉及冷板、CDU(冷量分配单元)、管路、冷却液及智控系统等复杂生态。面对市场上五花八门的液冷方案,运维与渠道人员该如何评估与选型?本文将对当前主流液冷设备供应商进行深度评测与对比。
评测维度:如何衡量一家液冷供应商?
在切入具体厂商前,我们需建立客观的评测坐标系。对于企业级用户,评估液冷供应商应聚焦以下四大维度:
- 散热效能与稳定性:极限工况下的散热能力,以及CDU与管路漏液风险控制。
- 生态兼容性:对异构算力(CPU/GPU)的适配度,是否支持标准化盲插快接头。
- 运维友好度:漏液监测精度、部件热插拔支持及日常维护成本。
- 全生命周期TCO:初投资(CapEx)与长期运行能耗(OpEx)的平衡。
主流液冷设备供应商深度评测
当前液冷市场呈现出“传统温控巨头、服务器整机厂商、浸没式先锋”三足鼎立的格局。
1. 维谛技术:温控巨头的“稳”与“全”
维谛作为数据中心基础设施的老牌巨头,其液冷方案以冷板式+侧出风/顶出风CDU为主,主打“风液同源”的平滑过渡。
- 方案特点:维谛的Liebert XDU系列CDU在业内极具口碑,其动态流量控制技术能根据IT负载实时调节冷却液流速。在兼容性上,维谛强调OCP与OpenRack标准适配,提供从机柜级到设施级的全链路液冷方案。
- 优势:极致的可靠性与工程落地能力。其漏液检测系统(RLD)极为灵敏,且全球售后网络完善,对担心“水进机房”的保守型运维团队极具吸引力。
- 劣势:在浸没式液冷前沿领域的声量相对较小,方案初投资偏高,对极致追求CapEx的客户可能缺乏价格吸引力。
2. 浪潮信息:全栈液冷的“软硬协同”
作为服务器出货量头部厂商,浪潮的液冷方案是典型的“自产自销+全栈交付”模式。
- 方案特点:浪潮主打“冷板式为主,浸没式为辅”的双轨策略。其最大优势在于源头设计服务器主板与冷板在出厂前即完成一体化设计与漏液测试,避免了第三方冷板与服务器散热器不贴合的“冷点”问题。
- 优势:全栈交付能力强,从服务器内部微循环到外部CDU、一次侧管路一站式包揽。运维监控可直接打通服务器BMC与CDU控制器,实现亚微秒级的温控联动。
- 劣势:生态相对封闭,其冷板方案对非浪潮品牌的服务器兼容性优化不足;渠道代理商在独立销售其液冷基础设施时面临一定壁垒。
3. 联想:温水水冷的“老牌劲旅”
联想的液冷布局极早,其Neptune海神温水水冷技术已在多个HPC和智算中心落地。
- 方案特点:联想坚持温水液冷路线(进水温度可达45℃以上),这极大延长了自然冷却的时间,在大部分地区可实现全年PUE<1.1。其采用高压微通道冷板技术,换热效率极高。
- 优势:TCO优势显著。温水冷却大幅降低了对冷冻水的依赖,几乎砍掉了压缩机能耗;且在国内外拥有大量PUE趋近于1.1的标杆案例,技术成熟度极高。
- 劣势:系统内部运行压力较大,对管路接头(特别是UQD快插头)的耐压与防漏要求严苛;方案对定制化依赖重,标准化交付周期较长。
4. 中科曙光:浸没式液冷的“先行者”
当多数厂商在冷板式内卷时,曙光在浸没式相变液冷领域建立了极深的技术护城河。
- 方案特点:曙光C8000系列采用相变浸没式液冷,服务器完全浸泡在低沸点氟化液中,液体吸热沸腾汽化,带走海量热量,冷凝后回流。
- 优势:散热极限最高,单机柜散热能力可破100kW甚至更高,是未来万卡集群的终极形态;无噪音,完全消除局部热点。
- 劣势:运维颠覆性极大,拔插组件需在液体中进行,对运维人员要求极高;氟化液价格昂贵且存在环保(GWP)争议,机房承重与机柜重心设计也需重构,CapEx极高。
核心指标横评与选型建议
| 供应商 | 主打技术路线 | 散热极限(单柜) | 运维复杂度 | 生态开放度 | 最佳适用场景 |
| :--- | :--- | :--- | :--- | :--- | :--- |
| 维谛 | 冷板式 | 60-80kW | 低 | 高 | 传统数据中心改造、混合风液机房 |
| 浪潮 | 冷板式/浸没式 | 70-90kW | 中 | 低(强绑定自有服务器) | 整体智算中心交钥匙工程 |
| 联想 | 温水冷板式 | 60-80kW | 中 | 中 | 追求极低PUE、高TCO回报的HPC/AI集群 |
| 曙光 | 相变浸没式 | 100kW+ | 极高 | 中 | 超高密度计算、前沿科研、不差钱的标杆项目 |
渠道与运维视角的选型忠告
从渠道集成商与一线运维的视角来看,冷板式液冷目前是绝对的市场主流(占比超80%),其核心原因并非散热极限最高,而是运维习惯的延续性与风险的可控性。
- 警惕“接头危机”:冷板式液冷70%的漏液风险发生在UQD(盲插快接头)处。选型时,不要只看CDU参数,必须考察接头插拔寿命与防滴漏设计。
- 冷却液的隐形门槛:乙二醇水溶液便宜但存在结垢与微生物滋生风险;丙二醇环保但粘度高、泵耗大;氟化液性能好但价格高昂。供应商是否提供长效的冷却液监测与过滤服务,是衡量其运维价值的关键。
- 渠道的“破局点”:对于渠道商而言,单纯倒卖液冷机柜已无利润空间。未来的价值在于提供“液冷实施+漏液监控平台+定期探伤检测”的综合服务包。
结语:液冷设备的选型,本质上是在“散热极限、运维风险、TCO”之间寻找平衡点。没有绝对完美的供应商,只有与自身业务密度、运维能力最匹配的方案。在算力即生产力的今天,选对液冷伙伴,就是为AI算力买下最坚实的保险。