跳到主要内容

AI 算力卡完整对比表(100+ 款)

数据持续更新中。发现错误?提交 Issue

快速筛选

场景推荐型号
万亿参数训练(GPT-4 级)NVIDIA B200, B300 Ultra, AMD MI400, Google TPU Ironwood
百亿-千亿参数训练NVIDIA H100, H200, AMD MI300X, MI325X
中国市场(国产替代)华为昇腾 910C, 920
高吞吐推理NVIDIA L40S, L4, H200 (推理模式)
边缘 AINVIDIA Jetson Orin, Google Edge TPU, Hailo-8L

数据中心训练 GPU

型号FP8 算力FP16 算力显存显存带宽TDP发布时间
NVIDIA Rubin R20050 PFLOPS (FP4)~10 PFLOPS288GB HBM422 TB/s~1,800W2026 H2
NVIDIA B300 Ultra14 PFLOPS~7 PFLOPS288GB HBM3e8 TB/s1,400W2026 H1
NVIDIA B2009 PFLOPS~4.5 PFLOPS192GB HBM3e8 TB/s1,000W2024 Q4
NVIDIA B1007 PFLOPS~3.5 PFLOPS192GB HBM3e8 TB/s700W2024 Q4
NVIDIA H2003,958 TFLOPS1,979 TFLOPS141GB HBM3e4.8 TB/s700W2024 Q2
NVIDIA H100 SXM53,958 TFLOPS1,979 TFLOPS80GB HBM33.35 TB/s700W2022 Q3
AMD MI40040 PFLOPS (FP4)~10 PFLOPS432GB HBM419.6 TB/s~1,000W2026 H2
AMD MI355X10.1 PFLOPS (MXFP6)~5 PFLOPS288GB HBM3e8 TB/s1,400W2025 H2
AMD MI350X9.2 PFLOPS (MXFP6)~4.6 PFLOPS288GB HBM3e8 TB/s750W2025 H2
AMD MI325X2,614 TFLOPS1,307 TFLOPS256GB HBM3e6.48 TB/s750W2024 Q4
AMD MI300X2,614 TFLOPS1,307 TFLOPS192GB HBM35.3 TB/s750W2023 Q4
华为昇腾 920900+ TFLOPS (BF16)~450 TFLOPS~96GB HBM4 Tbps~400W2025 H2
华为昇腾 910C780 TFLOPS (BF16)~390 TFLOPS128GB HBM2e1.2 TB/s310W×22024 H2
华为昇腾 910B320 TFLOPS (FP16)320 TFLOPS64GB HBM2e1.2 TB/s310W2023

数据中心推理 GPU

型号FP8 算力INT8 算力显存TDP适用场景
NVIDIA L40S733 TFLOPS1,466 TOPS48GB GDDR6350W数据中心推理
NVIDIA L4242 TFLOPS485 TOPS24GB GDDR672W边缘推理
NVIDIA L2~203 TFLOPS~406 TOPS16GB GDDR675W低功耗推理
NVIDIA RTX 6000 Ada1,452 TFLOPS2,905 TOPS48GB GDDR6300W工作站推理
NVIDIA T465 TFLOPS130 TOPS16GB GDDR670W入门推理

AI 训练 ASIC(TPU / Gaudi / Trainium)

型号厂商算力 (BF16)内存互联带宽发布时间
Google TPU v6e (Trillium)Google918 TFLOPS32GB HBM1.6 Tb/s2024
Google TPU Ironwood (v7)Google~2,000 TFLOPS192GB HBM~5 Tb/s2026 H1
Google TPU 8t (训练)Google~1,200 TFLOPS64GB+ HBM~3 Tb/s2026 H1
Google TPU 8i (推理)Google~1,500 TOPS64GB+ HBM~3 Tb/s2026 H1
Intel Gaudi 3Intel1,600 TFLOPS128GB SRAM2.4 Tb/s2024 Q2
AWS Trainium 3AWS~2,000 TFLOPS~128GB~3 Tb/s2025 H2
AWS Trainium 2AWS~1,000 TFLOPS64GB~1.6 Tb/s2024

晶圆级训练(Wafer-Scale)

型号厂商晶体管数片上内存FP16 算力发布时间
Cerebras WSE-4Cerebras4 万亿44GB SRAM125 PFLOPS2026
Cerebras WSE-3Cerebras4 万亿40GB SRAM125 PFLOPS2024
Cerebras WSE-2Cerebras2.6 万亿40GB SRAM85 PFLOPS2022

边缘 AI 与端侧 NPU

型号厂商算力 (TOPS)功耗适用场景
NVIDIA Jetson ThorNVIDIA2,070 TOPS130W机器人 / 自动驾驶
NVIDIA Jetson Orin AGXNVIDIA275 TOPS60W边缘推理
Google Edge TPU (Dev Board)Google4 TOPS2WIoT 端侧推理
Hailo-8LHailo13 TOPS1.5W端侧视觉 AI
高通 AI 100Qualcomm70 TOPS15W数据中心边缘推理
华为昇腾 310华为22 TOPS8W端侧推理

创新架构

型号架构类型核心特色厂商
Groq LPU (LPU v2)LPU(语言处理单元)极低延迟推理(~500 tok/s)Groq
Graphcore IPU (Bow POD)IPU(智能处理单元)图计算原生,1,400 个 IPU 核心Graphcore
Tesla Dojo (D1)分布式训练晶圆自动标注 + 模型训练一体化Tesla
Apple M5 Ultra (Neural Engine)SoC + NPU端侧 50 TOPS,统一内存Apple
Akida2 (AKD1000)脉冲神经网络 (SNN)超低功耗神经形态BrainChip

价格参考(云平台按需计费)

型号按需价格(USD/小时)预留价格(USD/小时)采购价格(USD)
NVIDIA B200$8.87~$5.50~$40,000
NVIDIA H200$5.87~$3.80~$30,000
NVIDIA H100$4.20~$2.80~$25,000
AMD MI300X~$15,000
华为昇腾 910C国内定价

注意:价格随市场供需波动,采购价格受出口管制影响。以上数据仅供参考。

选型建议

按模型规模选择

  • 万亿参数(GPT-4 级):NVIDIA B300 Ultra / Rubin R200,AMD MI400(2026 H2)
  • 百亿-千亿参数(Llama 70B, Qwen 72B):NVIDIA H100 / H200,AMD MI300X / MI325X
  • 十亿-百亿参数(Llama 7B-13B):NVIDIA H100, A100 80GB
  • 小模型 / 推理:NVIDIA L40S, L4, T4

按地区选择

  • 北美 / 欧洲:NVIDIA + AMD 自由选择
  • 中国:华为昇腾 910B / 910C / 920(国产替代)
  • 云端(无硬件偏好):任意厂商,按价格选择

← 返回首页 | 路线图 →