AMD Instinct MI350X / MI355X (CDNA 4)
产品概述
AMD Instinct MI350 系列于 2025 年 6 月 12 日发布,是 AMD 最新的旗舰 AI 加速器,基于 CDNA 4 架构。288GB HBM3e 显存,8 TB/s 带宽,FP16 算力高达 2.5 PFLOPS。MI350 引入原生 MXFP4 和 MXFP6 数据类型支持,对标 NVIDIA Blackwell。
核心规格
| 项目 | MI350X | MI355X |
|---|
| 架构 | CDNA 4 | CDNA 4 |
| 显存 | 288 GB HBM3e | 288 GB HBM3e |
| 带宽 | 8 TB/s | 8 TB/s |
| LLC | 256 MB | 256 MB |
| FP64 | 72.1 TFLOPS | 78.6 TFLOPS |
| FP16 Matrix | 2.3 PFLOPS | 2.5 PFLOPS |
| MXFP8 | 4.6 PFLOPS | 5.0 PFLOPS |
| MXFP6 | 9.2 PFLOPS | 10.1 PFLOPS |
| MXFP4 | 9.2 PFLOPS | 10.1 PFLOPS |
| TDP | 750 W | 1,400 W(液冷) |
| 散热 | 风冷 | 液冷(DLC) |
| PCIe | Gen 5 | Gen 5 |
厂商信息
MI350 平台 (UBB 2.0)
| 平台 | 配置 |
|---|
| 8× MI350X | 2.3 TB HBM3E,64 TB/s 聚合带宽,18.5 PFLOPS FP16 |
| 8× MI355X | 2.3 TB HBM3E,64 TB/s 聚合带宽,20.1 PFLOPS FP16 |
| 超大规模 | 128× 液冷 MI355X(16 UBB 8 卡托盘) |
MI350 vs Blackwell 对比
| 指标 | MI355X | B200 | GB200 (186GB) |
|---|
| 显存 | 288 GB | 192 GB | 186 GB |
| 带宽 | 8 TB/s | 8 TB/s | 8 TB/s |
| FP8 算力 | 10.1 PFLOPS(MXFP6) | 9 PFLOPS | 9 PFLOPS |
| FP4 支持 | ✓ MXFP4 | ✓ 原生 | ✓ 原生 |
关键差异:MI355X 显存更大(+50%),B200 FP4 算力更高(18 PFLOPS vs MI355X 10.1 PFLOPS)。
关键特性
- MXFP4 / MXFP6 原生支持:微缩浮点格式
- 4× 上一代 AI 算力(AMD 官方)
- 35× 上一代推理性能
- CDNA 4 架构(N3P 工艺 XCD)
- ROCm 7:新增 pip install rocm 简易安装
适用场景
- 万亿参数 LLM 训练与推理
- 长上下文推理
- MoE 模型(Mixtral、Llama 4)
- HPC 与 AI 混合负载
相关产品对比