Skip to main content

AWS Trainium 2 (Trn2)

产品概述

AWS Trainium 2 于 2024 年 12 月 3 日在 re:Invent 2024 大会上 GA,是第二代 AWS 自研 AI 训练芯片。性能是第一代的 4 倍FP8 算力 1,299 TFLOPS(密集)/ 2,563 TFLOPS(稀疏),96GB HBM 容量,2.9 TB/s 带宽。Trn2 实例包含 16 颗 Trainium2 芯片。Trn2 UltraServer 通过 NeuronLink 互联 4 个实例,组成 64 颗芯片

核心规格

项目参数
架构Trainium2(NeuronCore-v3)
制程TSMC 4nm(推测)
NeuronCore8 颗/芯片(NeuronCore-v3)
显存96 GB HBM(3× 第一代)
显存带宽2.9 TB/s(3.6× 第一代)
FP8 算力1,299 TFLOPS(密集)/ 2,563(稀疏)
BF16/FP16/TF32667 TFLOPS
FP32181 TFLOPS
TDP约 700 W
NeuronLinkNeuronLink-v3(1.28 TB/s 双向)
DMA 带宽3.5 TB/s

Trainium 1 vs Trainium 2

指标Trainium 1Trainium 2提升
工艺7nm4nm
NeuronCore32 颗/芯片8 颗/芯片简化
HBM 容量32 GB96 GB
HBM 带宽0.8 TB/s2.9 TB/s3.6×
FP8 算力191 TFLOPS1,299 TFLOPS6.7×
BF16/FP16191 TFLOPS667 TFLOPS3.4×
FP3248 TFLOPS181 TFLOPS3.7×

Trn2 实例与 UltraServer

形态配置算力
Trn2.48xlarge16 颗 Trainium220.8 FP8 PFLOPS
Trn2 UltraServer64 颗 Trainium2(4× Trn2)83.2 FP8 PFLOPS
Project Rainier数十万颗 Trainium2(Anthropic)5× Anthropic 当前

厂商信息

项目内容
制造商Amazon (Annapurna Labs)
官网https://aws.amazon.com/machine-learning/trainium/
产品页https://aws.amazon.com/ec2/instance-types/trn2/
SDKhttps://awsdocs-neuron.readthedocs-hosted.com/
发布2024 年 12 月 3 日 GA

关键特性

  • Logical NeuronCore Configuration (LNC):多个物理核合并为逻辑核
  • NeuronLink 2D Torus:低延迟高带宽
  • 30-40% 性价比 优势 vs EC2 P5e/P5en(H100)
  • EFAv3 互联:3.2 Tbps
  • UltraServer 64 芯片:万亿参数训练

适用场景

  • LLM 训练(千亿到万亿参数)
  • 大规模推理
  • 训练 + 推理 fungible

相关产品对比