NVIDIA A100 (Ampere)

产品概述

NVIDIA A100 于 2020 年发布，是数据中心 AI 加速的里程碑产品，引入了 MIG（Multi-Instance GPU） 和 TF32 / FP16 / BF16 Tensor Core。尽管已被 H100 取代，A100 仍是当前最广泛的部署中 AI 训练 GPU，搭载 40GB / 80GB HBM2e 显存。

核心规格

项目	40GB 版	80GB 版
发布	2020 年 6 月 GTC	2020 年 6 月 GTC
架构	Ampere GA100	Ampere GA100
制程	TSMC 7nm	TSMC 7nm
晶体管数	540 亿	540 亿
显存	40 GB HBM2e	80 GB HBM2e
显存带宽	1,555 GB/s	1,935 GB/s
CUDA Core	6,912	6,912
Tensor Core	432（第三代）	432（第三代）
FP32	19.5 TFLOPS	19.5 TFLOPS
FP64	9.7 TFLOPS	9.7 TFLOPS
TF32 Tensor Core	156 TFLOPS	156 TFLOPS
FP16/BF16 Tensor Core	312 TFLOPS	312 TFLOPS
INT8 Tensor Core	624 TOPS	624 TOPS
TDP	250 W / 400 W	300 W / 400 W
NVLink	600 GB/s	600 GB/s
MIG	最多 7 实例	最多 7 实例

厂商信息

项目	内容
制造商	NVIDIA Corporation
官网	https://www.nvidia.com
产品页	https://www.nvidia.com/en-us/data-center/a100/

软件与驱动

驱动：https://www.nvidia.com/Download/index.aspx
CUDA 11.0+ 完整支持
完整 cuDNN、TensorRT、NCCL 生态

关键特性

第三代 Tensor Core：支持 TF32、FP16、BF16、INT8
MIG（多实例 GPU）：将单卡分为最多 7 个独立实例
结构化稀疏：硬件级 2:4 稀疏加速
NVLink 3.0：600 GB/s 互联带宽

适用场景

LLM 训练（7B–70B 模型）
推理部署
科学计算 HPC
推荐系统

产品概述​

核心规格​

厂商信息​

软件与驱动​

关键特性​

适用场景​

相关产品对比​

产品概述

核心规格

厂商信息

软件与驱动

关键特性

适用场景

相关产品对比