跳到主要内容

NVIDIA H200 (Hopper Refresh)

产品概述

NVIDIA H200 于 2024 年发布,是 H100 的显存升级版本。最大变化是从 80GB HBM3 升级到 141GB HBM3e,带宽从 3.35 TB/s 提升到 4.8 TB/s(+43%)。这让 H200 在 70B+ 参数大模型推理场景下性能显著提升,可单卡加载更长的上下文。

核心规格

项目参数
架构Hopper GH100(refresh)
制程TSMC 4N
晶体管数800 亿
显存141 GB HBM3e
显存带宽4.8 TB/s(4,800 GB/s)
CUDA Core16,896
Tensor Core528 个(第四代)
FP8 Tensor Core3,958 TFLOPS(稀疏)
TDP700 W(SXM5)
互联NVLink 4.0(900 GB/s),PCIe 5.0
MIG最多 7 个实例
形式SXM5 / PCIe 5.0

H100 vs H200 对比

指标H100H200提升
显存容量80 GB141 GB+76%
显存类型HBM3HBM3e更快
显存带宽3.35 TB/s4.8 TB/s+43%
FP8 算力3,958 TFLOPS3,958 TFLOPS相同
售价(参考)约 $25,000–30,000约 $30,000–35,000+20%

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/h200/
发布2024 年 11 月(首批出货)

软件与驱动

适用场景

  • 大模型推理(70B+ 单卡加载)
  • 长上下文(100K+ tokens)推理
  • 大模型微调
  • HPC 内存受限型工作负载

相关产品对比