跳到主要内容

ASIC (Application-Specific Integrated Circuit) 架构

什么是 ASIC

ASIC(Application-Specific Integrated Circuit) 是为特定应用定制的 AI 加速器,相比 GPU 的通用性,ASIC 在特定工作负载下提供更高能效比更低单位 token 成本

代表产品

  • AWS Trainium / Trainium 2:训练 + 推理 fungible
  • AWS Inferentia / Inferentia 2:纯推理
  • Qualcomm AI 100 (AIC100):低功耗数据中心推理
  • Google TPU(部分分类为 ASIC)

ASIC vs GPU

维度ASICGPU
通用性(特定工作负载)(任意 AI 任务)
能效比2-3× 优于 GPU
性能/瓦特
单位 token 成本
开发周期2-3 年1-2 年
生态厂商自研CUDA 成熟
灵活升级难(流片固定)易(驱动更新)
适用大规模推理通用 AI

AWS Trainium / Inferentia

AWS Trainium

  • Trainium 1(2020):首款 AWS 自研训练芯片
  • Trainium 2(2024-12 GA):96GB HBM、1,299 FP8 TFLOPS、4× Trainium 1
  • Trainium 3(2025 末):传闻 2× Trainium 2
  • NeuronLink 互联,64 颗 UltraServer
  • Neuron SDK(PyTorch / TensorFlow 集成)
  • 客户:Anthropic、AWS 内部

AWS Inferentia

  • Inferentia 1(2019):128 TOPS INT8
  • Inferentia 2(2023):32GB HBM2e,~190 TOPS,12 芯片互联
  • Inf1 / Inf2 实例(AWS EC2 租赁)
  • 推理成本比 GPU 低 70%

Qualcomm AI 100 (AIC100)

  • 2020 发布(疫情前)
  • 400 TOPS INT875W TDP
  • 2.67 TOPS/W(性能/瓦特领先 GPU)
  • Qualcomm AI Engine Direct SDK
  • 客户:Hugging Face Inference API、Oracle Cloud

ASIC 适用场景

  • 大规模数据中心推理(Inf2、Trn2)
  • ✅ 超大规模 LLM 推理(Hugging Face)
  • ✅ 训练 + 推理 fungible(Trainium 2)
  • ✅ 性价比推理(Inferentia 1/2)
  • ✅ 低功耗数据中心(Qualcomm AI 100)
  • ❌ 多任务通用(应使用 GPU)
  • ❌ 新算法快速迭代(应使用 GPU)

详细产品页

AWS

Qualcomm

国产 AI 创业

Tenstorrent

相关架构