产品概述
NVIDIA B100 于 2024 年发布,是 Blackwell 架构的入门级数据中心 GPU。它采用**双芯片(dual-die)**设计,通过 10 TB/s 的 NV-HBI 内部桥接互联。B100 保持 700W TDP 相对低功耗,可直接滑入 H100/H200 现有服务器底板,是云服务商大批量部署 Blackwell 的首选之一。
重要:B100 在 2024-2025 年实际部署中已被 B200 超越,许多云厂商(如 Modal、CoreWeave)直接跳过 B100。
核心规格
| 项目 | 参数 |
|---|
| 架构 | Blackwell GB100 |
| 制程 | TSMC 4NP |
| 晶体管数 | 2,080 亿(双芯片) |
| 显存 | 192 GB HBM3e |
| 显存带宽 | 8 TB/s |
| FP4 Tensor Core | 14 PFLOPS(稀疏) |
| FP6 Tensor Core | ~9.3 PFLOPS(稀疏,推算) |
| FP8 Tensor Core | 7 PFLOPS(稀疏) |
| FP16 Tensor Core | 3.5 PFLOPS(稀疏) |
| FP64 Tensor Core | 30 TFLOPS |
| NVLink | 1.8 TB/s(第五代) |
| TDP | 700 W |
| PCIe | Gen 5 |
| 形式 | SXM |
B100 vs B200 关键差异
| 指标 | B100 | B200 | 优势 |
|---|
| TDP | 700 W | 1,000 W | B100 更低 |
| FP4 算力 | 14 PFLOPS | 18 PFLOPS | B200 +28% |
| FP8 算力 | 7 PFLOPS | 9 PFLOPS | B200 +28% |
| 显存 | 192 GB HBM3e | 192 GB HBM3e | 相同 |
| 显存带宽 | 8 TB/s | 8 TB/s | 相同 |
| 服务器兼容 | 兼容 H100/H200 底板 | 需新服务器 | B100 更灵活 |
| 价格(参考) | N/A | $5.87/hr(云端) | — |
厂商信息
软件与驱动
关键特性
- 第五代 Tensor Core:原生支持 FP4 / FP6 精度
- 第二代 Transformer Engine:自动 FP4 精度转换
- NVLink 5.0:1.8 TB/s GPU 间互联
- RAS 引擎:可靠性、可用性、可服务性
- 机密计算:硬件级 TEE 支持
适用场景
- LLM 训练与推理
- MoE(混合专家)模型
- 推荐系统
- 现有 H100 集群的渐进式升级
相关产品对比