跳到主要内容

NVIDIA B100 (Blackwell)

产品概述

NVIDIA B100 于 2024 年发布,是 Blackwell 架构的入门级数据中心 GPU。它采用**双芯片(dual-die)**设计,通过 10 TB/s 的 NV-HBI 内部桥接互联。B100 保持 700W TDP 相对低功耗,可直接滑入 H100/H200 现有服务器底板,是云服务商大批量部署 Blackwell 的首选之一。

重要:B100 在 2024-2025 年实际部署中已被 B200 超越,许多云厂商(如 Modal、CoreWeave)直接跳过 B100。

核心规格

项目参数
架构Blackwell GB100
制程TSMC 4NP
晶体管数2,080 亿(双芯片)
显存192 GB HBM3e
显存带宽8 TB/s
FP4 Tensor Core14 PFLOPS(稀疏)
FP6 Tensor Core~9.3 PFLOPS(稀疏,推算)
FP8 Tensor Core7 PFLOPS(稀疏)
FP16 Tensor Core3.5 PFLOPS(稀疏)
FP64 Tensor Core30 TFLOPS
NVLink1.8 TB/s(第五代)
TDP700 W
PCIeGen 5
形式SXM

B100 vs B200 关键差异

指标B100B200优势
TDP700 W1,000 WB100 更低
FP4 算力14 PFLOPS18 PFLOPSB200 +28%
FP8 算力7 PFLOPS9 PFLOPSB200 +28%
显存192 GB HBM3e192 GB HBM3e相同
显存带宽8 TB/s8 TB/s相同
服务器兼容兼容 H100/H200 底板需新服务器B100 更灵活
价格(参考)N/A$5.87/hr(云端)

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/blackwell/
架构代号Umbriel(内部代号)

软件与驱动

关键特性

  • 第五代 Tensor Core:原生支持 FP4 / FP6 精度
  • 第二代 Transformer Engine:自动 FP4 精度转换
  • NVLink 5.0:1.8 TB/s GPU 间互联
  • RAS 引擎:可靠性、可用性、可服务性
  • 机密计算:硬件级 TEE 支持

适用场景

  • LLM 训练与推理
  • MoE(混合专家)模型
  • 推荐系统
  • 现有 H100 集群的渐进式升级

相关产品对比