Skip to main content

WSE (Wafer-Scale Engine) 架构

什么是 WSE

WSE(Wafer-Scale Engine)Cerebras Systems 推出的晶圆级 AI 处理器,将整片 12 英寸晶圆作为单芯片(vs 传统 GPU 仅占晶圆一小块)。

Cerebras WSE-3(2024-04 发布)拥有 4 万亿晶体管、90 万核心、44 GB SRAM,专为超大规模 AI 训练(Llama 3 405B、GPT-4 类)设计。

WSE 核心创新

晶圆级集成

  • 传统 GPU 芯片 ~800 mm²(~3% 晶圆面积)
  • WSE 整片晶圆 = 46,225 mm²(57× 倍)
  • 片上 SRAM 44GB(vs H100 80GB HBM,但 SRAM 比 HBM 快 1000×)
  • 片上互联 214 PB/s(Fabric 带宽)

稀疏线性代数核(SLAK)

  • 专为GEMM(矩阵乘)和 sparse 操作优化
  • 比 GPU tensor core 更快(特定工作负载)

SwarmX 互联

  • 多 WSE 系统:Cerebras CS-3 集群
  • 通过 SwarmX fabric 连接(~1.2 TB/s)
  • CS-3 Cluster = 2,048 WSE = 8 ExaFLOPS

主流 WSE 对比

WSE年份晶体管核心SRAM工艺算力(FP16)
WSE-120191.2T40 万18 GBTSMC 16nm-
WSE-220212.6T85 万40 GBTSMC 7nm~62 PFLOPS
WSE-320244T90 万44 GBTSMC 5nm125 PFLOPS
WSE-4 (CS-4, 推测)2027 预计~5T~150 万~80 GBTSMC 3nm~200 PFLOPS

⚠️ WSE-4 未官方公布,以上为推测。Cerebras 已于 2026-04-17 申请 IPO,WSE-4 将是 IPO 后的第一代公开产品

WSE vs GPU

维度WSE-3H100 SXMMI300X
晶体管4 万亿800 亿1530 亿
核心90 万(稀疏核)14,592 CUDA14,592 SP
内存44 GB SRAM80GB HBM3192GB HBM3
内存带宽~1 PB/s3.35 TB/s5.3 TB/s
TDP~15 kW700W750W
算力(FP16)125 PFLOPS989 TFLOPS1.5 PFLOPS
部署整机(Cerebras CS-3)PCIe/SXM 卡PCIe 卡
适用超大模型训练通用训练通用训练

WSE 适用场景

  • 超大 LLM 训练(Llama 3 405B、GPT-4 类)
  • ✅ 基因组学(生物医药)
  • ✅ 科学计算(HPC)
  • ✅ 长序列训练(44GB SRAM 可加载超大 batch)
  • ❌ 通用 AI 推理(应使用 GPU)
  • ❌ 边缘部署(15kW TDP)
  • ❌ 中小模型训练(成本不划算)

商业部署

  • G42(阿联酋 AI 公司,9 亿美元订单)
  • Mayo Clinic(医疗 AI)
  • Argonne National Lab(科学计算)
  • Llama 3 405B 训练(Meta 与 Cerebras 合作)

2026 Cerebras IPO(重大事件)

项目内容
IPO 申请日期2026-04-17(S-1 提交)
目标上市日期2026-05(Nasdaq: CBRS
估值$22-25B
2025 营收~$510M(同比 +150%)
2025 净亏损~$200M(仍亏损,但亏损率收窄)
关键大单OpenAI $10B 推理算力长期合同
主要客户OpenAI、G42、Mistral、Meta、Mayo Clinic
投行高盛 / 摩根士丹利 / 摩根大通

💡 IPO 战略意义

  • Cerebras 是全球第二大晶圆级 AI 公司(仅次于 NVIDIA 市值)
  • OpenAI $10B 合同 = 单一客户史上最大推理算力订单
  • WSE-4 (CS-4) 将是 IPO 后第一代公开产品(2027 预计)
  • 与 NVIDIA Groq 3 LPX 竞争超低延迟推理市场

详细产品页

相关架构