大模型(LLM)和生成式AI的爆发,让GPU与AI芯片成为了数字时代最硬的硬通货。然而,受制于地缘政治、产能周期与市场投机情绪的双重叠加,当前GPU/AI芯片的渠道价格呈现出极强的波动性与非理性特征。对于AI初创企业、智算中心及各类政企客户而言,摸清渠道底价、识别渠道陷阱、制定科学的采购策略,已成为降低算力成本、保障业务连续性的核心竞争力。
进入2024年,随着台积电CoWoS先进封装产能的逐步释放,全球GPU供应紧张的局面有所缓解,但渠道价格并未出现单边下跌,而是呈现出显著的“结构性分化”:
作为大模型训练的绝对主力,H100曾一度炒出30万元人民币的天价。目前,随着H20等特供版芯片的铺货及产能提升,H100现货渠道价已回落至15-18万元区间,逐步向MSRP(建议零售价)靠拢。期货价格则更为透明,交期从曾经的6个月以上缩短至8-12周。
受限于算力阉割,H20上市初期曾遭遇渠道观望。但随着国产大模型转向MoE架构及推理侧发力,H20在集群组网下的实际表现得到验证,渠道拿货价(单卡)目前稳定在9-11万元左右。L40S作为图形与AI推理的甜点级产品,渠道价格在4-5万元,货源相对充足。
以华为腾910B为代表的国产算力正在快速填补市场空白。受制于先进制程产能,910B渠道同样存在一定紧缺,单卡价格坚挺在10万元上下。其渠道价格不仅包含硬件本身,更包含了达梦数据库、思框架等国产化生态适配的“隐性溢价”。
随着早期算力中心淘汰旧卡,二手市场活跃。A100 40GB渠道价甚至被炒至高于H20,但其中充斥着矿卡翻新、显存降级甚至篡改BIOS的“魔改卡”,价格虽低(6-8万),但故障率极高,需极度警惕。
理解价格波动,必须看透渠道结构。当前国内GPU/AI芯片渠道主要分为三个层级:
面对错综复杂的渠道环境,IT与运维采购决策者应摒弃“追涨杀跌”的投机心理,回归业务本质,采取以下策略:
1. 期现结合,锁定成本与交付
不要将所有预算砸向现货市场。建议采用“期货保底+现货救急”的组合策略。将60%-70%的算力需求通过OEM原厂或核心代理以期货形式锁定价格与交期,确保基建底线;剩余30%的突发需求在现货市场寻找短期过渡,避免承受全额溢价。
2. 整机采购优于裸卡采购
在当前渠道中,单买裸卡(尤其是高端卡)不仅价格畸高,且难以获得原厂质保。通过OEM采购GPU服务器整机(如8卡H20或H800服务器),不仅单卡均摊成本更低,还能获得原厂三年维保及集群网络(InfiniBand/RoCE)的调优服务,大幅降低后期运维OPEX。
3. 严控二手渠道风控,拒绝“OEM锁卡”
如果必须涉足二手现货市场,务必做好验机:使用nvidia-smi -q核查Board Part Number,防止买到OEM定制锁卡(这类卡无法在非特定品牌主板上点亮);运行gpu-burn进行至少48小时的满载压力测试,排查显存虚焊与算力衰减问题。切勿轻信“拆机全新”的话术。
4. 算力平替:拥抱异构与国产化
采购不应只有NVIDIA一个选项。对于推理侧及微调场景,AMD Instinct系列(MI300)或寒武纪、壁仞等国产芯片在特定框架下已具备平替能力。建议在集群中预留10%-15%的异构算力池,通过Kubernetes及vLLM等框架进行统一调度,这不仅能大幅降低采购成本,更是应对未来制裁升级的未雨绸缪。
GPU/AI芯片的渠道博弈,本质上是信息差与资源调配能力的较量。在算力逐渐从“绝对稀缺”走向“结构性平衡”的当下,采购方更应保持定力。摸清渠道底价、识别货源层级、严控验机标准、布局异构算力,才能在这场算力军备竞赛中,以最优的TCO(总拥有成本)跑赢大模型时代。