产品概述
NVIDIA A100 于 2020 年发布,是数据中心 AI 加速的里程碑产品,引入了 MIG(Multi-Instance GPU) 和 TF32 / FP16 / BF16 Tensor Core。尽管已被 H100 取代,A100 仍是当前最广泛的部署中 AI 训练 GPU,搭载 40GB / 80GB HBM2e 显存。
核心规格
| 项目 | 40GB 版 | 80GB 版 |
|---|
| 架构 | Ampere GA100 | Ampere GA100 |
| 制程 | TSMC 7nm | TSMC 7nm |
| 晶体管数 | 540 亿 | 540 亿 |
| 显存 | 40 GB HBM2e | 80 GB HBM2e |
| 显存带宽 | 1,555 GB/s | 1,935 GB/s |
| CUDA Core | 6,912 | 6,912 |
| Tensor Core | 432(第三代) | 432(第三代) |
| FP32 | 19.5 TFLOPS | 19.5 TFLOPS |
| FP64 | 9.7 TFLOPS | 9.7 TFLOPS |
| TF32 Tensor Core | 156 TFLOPS | 156 TFLOPS |
| FP16/BF16 Tensor Core | 312 TFLOPS | 312 TFLOPS |
| INT8 Tensor Core | 624 TOPS | 624 TOPS |
| TDP | 250 W / 400 W | 300 W / 400 W |
| NVLink | 600 GB/s | 600 GB/s |
| MIG | 最多 7 实例 | 最多 7 实例 |
厂商信息
软件与驱动
关键特性
- 第三代 Tensor Core:支持 TF32、FP16、BF16、INT8
- MIG(多实例 GPU):将单卡分为最多 7 个独立实例
- 结构化稀疏:硬件级 2:4 稀疏加速
- NVLink 3.0:600 GB/s 互联带宽
适用场景
- LLM 训练(7B–70B 模型)
- 推理部署
- 科学计算 HPC
- 推荐系统
相关产品对比