跳到主要内容

NVIDIA A100 (Ampere)

产品概述

NVIDIA A100 于 2020 年发布,是数据中心 AI 加速的里程碑产品,引入了 MIG(Multi-Instance GPU)TF32 / FP16 / BF16 Tensor Core。尽管已被 H100 取代,A100 仍是当前最广泛的部署中 AI 训练 GPU,搭载 40GB / 80GB HBM2e 显存。

核心规格

项目40GB 版80GB 版
架构Ampere GA100Ampere GA100
制程TSMC 7nmTSMC 7nm
晶体管数540 亿540 亿
显存40 GB HBM2e80 GB HBM2e
显存带宽1,555 GB/s1,935 GB/s
CUDA Core6,9126,912
Tensor Core432(第三代)432(第三代)
FP3219.5 TFLOPS19.5 TFLOPS
FP649.7 TFLOPS9.7 TFLOPS
TF32 Tensor Core156 TFLOPS156 TFLOPS
FP16/BF16 Tensor Core312 TFLOPS312 TFLOPS
INT8 Tensor Core624 TOPS624 TOPS
TDP250 W / 400 W300 W / 400 W
NVLink600 GB/s600 GB/s
MIG最多 7 实例最多 7 实例

厂商信息

项目内容
制造商NVIDIA Corporation
官网https://www.nvidia.com
产品页https://www.nvidia.com/en-us/data-center/a100/
发布2020 年 6 月 GTC

软件与驱动

关键特性

  • 第三代 Tensor Core:支持 TF32、FP16、BF16、INT8
  • MIG(多实例 GPU):将单卡分为最多 7 个独立实例
  • 结构化稀疏:硬件级 2:4 稀疏加速
  • NVLink 3.0:600 GB/s 互联带宽

适用场景

  • LLM 训练(7B–70B 模型)
  • 推理部署
  • 科学计算 HPC
  • 推荐系统

相关产品对比