SambaNova SN50 (RDU 第三代, 2026 推测)
:::warning 推测内容 本页规格基于 SambaNova 2024-Q4 公开声明 + Kunle Olukotun 团队访谈 + 路线图综合推测。SambaNova 官方尚未发布 SN50 完整规格,正式数据以 2026 H2 实际发布为准。 :::
产品概述
SambaNova SN50 是 SambaNova 第三代 Reconfigurable Dataflow Unit (RDU),预计 2026 H2 发布(SN40L 于 2024-09 发布)。基于 TSMC 3nm 制程,256GB HBM3E 内存,Dataflow 架构(与传统 GPU 命令式架构不同),SN40L 2× 性能。配套 SambaFlow 软件栈(PyTorch / TensorFlow / JAX 兼容)。
SambaNova 战略地位:与 Groq、Tenstorrent、Cerebras 并称"美国 AI 芯片创业四小龙"(Groq LPU、Tenstorrent RISC-V、Cerebras WSE、SambaNova RDU)。在 NVIDIA CUDA 主导市场,SambaNova 是少数仍能保持企业级商业化的创业公司(客户:PayPal、Astera Labs、Constellation、国家实验室)。
核心规格(推测)
| 项目 | 参数 |
|---|---|
| 架构 | SambaNova RDU 第三代 |
| 制程 | TSMC 3nm (N3) |
| HBM | 256GB HBM3E(SN40L 是 128GB HBM3) |
| 内存带宽 | ~5.5 TB/s(SN40L 3.2 TB/s) |
| BF16 dense | 1.5 PFLOPS(SN40L 638 TF,2.4×) |
| FP8 dense | 3 PFLOPS(推测,SN40L 不支持 FP8) |
| INT8 | 6 POPS(推测) |
| TDP | ~700 W |
| 板卡形态 | OAM / PCIe Gen5 |
| 互连 | SambaNova Dataflow Link(自研) |
| 集群 | DataScale SN50(多卡全互联) |
| 量产 | 2026 H2(推测) |
| 单价 | ~$40,000-50,000(推测) |
与 SN40L 对比
| 指标 | SN50 (2026 H2 推测) | SN40L (2024-09) | 提升 |
|---|---|---|---|
| 制程 | TSMC 3nm | TSMC 5nm | 新代 |
| HBM | 256GB HBM3E | 128GB HBM3 | 2× |
| 带宽 | 5.5 TB/s | 3.2 TB/s | 1.7× |
| BF16 dense | 1.5 PF | 638 TF | 2.4× |
| FP8 dense | 3 PF (推测) | N/A | 新增 |
| TDP | 700W | 600W | +17% |
| 集群 | DataScale 8/16/32 卡 | DataScale 8/16 卡 | 32 卡 |
| 价格(推测) | ~$45K | ~$30K | +50% |
SambaNova Dataflow 架构
| 维度 | 传统 GPU | SambaNova RDU |
|---|---|---|
| 执行模型 | 命令式(指令流) | 数据流(图执行) |
| 并行性 | 线程级(CUDA cores) | 算子级(dataflow graph) |
| 片上缓存 | 共享 L2 + 寄存器 | 大型分布式 SRAM(专利) |
| 数据局部性 | 受 HBM 限制 | 片上数据移动(图优化) |
| 编译器 | CUDA / OpenCL | SambaFlow(专用) |
| 优势 | 通用 + 灵活 | 数据流优化,LLM 推理延迟低 |
| 缺点 | - | 训练生态弱、PyTorch 兼容需手工优化 |
Dataflow 执行
传统 GPU:
for (i = 0; i < N; i++) {
y[i] = W * x[i]; // 每次访问 HBM
}
RDU Dataflow:
配置:图 W → 算子 → 累加器
输入 x → 触发图执行 → 输出 y
优势:仅 1 次 HBM 访问(输入)+ 1 次(输出)
SambaFlow 软件栈
| 层级 | 工具 | 说明 |
|---|---|---|
| AI 框架 | SambaFlow | PyTorch / TensorFlow / JAX 兼容 |
| SambaNova CoT | Compiler of Things(图编译器) | |
| Reference Models | LLaMA / Mistral / Qwen / SDXL 预优化 | |
| 编译器 | CoT Compiler | 模型 → RDU 二进制 |
| 运行时 | SambaFlow Runtime | 多卡协调 |
| 企业特性 | SambaNova Suite | 私有云部署 + 推理 API |
| API | SambaNova API | OpenAI 兼容(部分) |
⚠️ 生态限制:相比 CUDA 18 年生态,SambaFlow 仅 5-6 年,但SambaNova 在企业部署做得比 Cerebras/Groq 好(PayPal 处理 1B+ 交易 / 天,Astera Labs 半导体设计验证)。
厂商信息
| 项目 | 内容 |
|---|---|
| 公司 | SambaNova Systems |
| 创始人 | Kunle Olukotun(Stanford 教授)+ Christopher Ré + Rodrigo Liang |
| 成立 | 2017 |
| 总部 | 美国加州帕罗奥图(Palo Alto) |
| 融资 | $1.1B+(D 轮 2021-Q1 领投:SoftBank、Intel Capital) |
| 估值(2025) | $5B+(独角兽) |
| 2024 营收 | ~$80M(快速增长) |
| 员工 | ~500 人 |
| 代工 | TSMC 5nm → 3nm |
| 客户 | PayPal、Astera Labs、Constellation、US National Labs |
| 状态 | 未上市(考虑 2026-2027 IPO) |
SambaNova 产品线
| 产品 | 发布 | 算力 BF16 | 内存 | 状态 |
|---|---|---|---|---|
| SN10 | 2021 | 300 TF | 320GB DDR4 | EOL |
| SN25 | 2022-Q3 | 300 TF | 320GB DDR4 | EOL |
| SN30 | 2023-Q2 | 600 TF | 1.5TB DDR4 | 量产 |
| SN40L | 2024-09 | 638 TF | 128GB HBM3 | 当前旗舰 |
| SN50 | 2026 H2 (推测) | 1.5 PF | 256GB HBM3E | 路线图 |
| SN60 (推测) | 2027+ | ? | ? | 长期路线图 |
美国 AI 芯片创业四小龙
| 公司 | 架构 | 代表产品 | 融资 | 状态 |
|---|---|---|---|---|
| SambaNova | Dataflow RDU | SN40L / SN50 | $1.1B+ | 商业化领先 |
| Cerebras | 晶圆级 WSE | WSE-3 | $1.5B+ | 2026 IPO |
| Groq | LPU | LPU v2 / LPX | $1B+ | 2026 NVIDIA 收购 |
| Tenstorrent | RISC-V | Wormhole / Blackhole | $700M+ | 客户开发中 |
关键特性
- Dataflow 架构:图执行,LLM 推理延迟低
- SambaFlow 企业部署:唯一成功企业商业化的 AI 创业公司(PayPal $40M+ 合同)
- 大型 SRAM:SN40L 256MB SRAM + HBM3 128GB
- FP8 支持:SN50 新增 FP8(追上 NVIDIA Blackwell)
- 缺点:训练生态弱、硬件成本高
适用场景
- ✅ 大企业 LLM 部署(PayPal、Astera Labs)
- ✅ LLM 推理(Dataflow 优化延迟)
- ✅ 半导体设计验证(Astera Labs 实际使用)
- ✅ 政府 HPC(美国国家实验室)
- ✅ 私有云部署(on-premise,企业数据安全)
- ❌ 小公司(成本高、起步 $100K+)
- ❌ AI 训练为主(Dataflow 训练弱)
- ❌ CUDA 专有工作负载
SambaNova DataScale 机柜
| 维度 | DataScale SN40L | DataScale SN50 (推测) |
|---|---|---|
| RDU 数 | 8 / 16 | 8 / 16 / 32 |
| 总算力 | 5.1 PF / 10.2 PF | 12 PF / 24 PF / 48 PF |
| 总 HBM | 1 TB / 2 TB | 2 TB / 4 TB / 8 TB |
| 总 SRAM | 2 GB / 4 GB | 4 GB / 8 GB / 16 GB |
| 机柜 TDP | 4.8 kW / 9.6 kW | 5.6 kW / 11.2 kW / 22.4 kW |
| 机柜价格 | ~$300K / $600K | ~$400K / $800K / $1.6M |
相关卡
- SambaNova SN40L - 当前旗舰
- Groq LPU v2 - LPU 推理对比
- Cerebras WSE-3 - 晶圆级对比
- Tenstorrent - RISC-V 对比
- NVIDIA H200 - 传统 GPU 对比
- AMD MI355X - 业界对比
- Lightmatter Envise - 硅光对比