Skip to main content

AI 集群的电力危机:1MW 机柜、核电站、SMR 与绿色 AI

· 8 min read
AI Compute Cards Wiki Editorial
Industry Research Team

2026 年 AI 算力增长遇到了硬约束——电力。当 NVIDIA Rubin NVL576 单机柜功耗 1 MW、xAI Colossus 集群 200 MW、OpenAI 计划中的 Stargate 园区 5 GW 时,电力供应正在成为 AI 发展的最大瓶颈。本文深入分析这场「电力危机」与应对方案。

电力需求:指数级增长

单机柜功耗演进

年份代表机柜单机柜功耗集群规模总功耗
2020DGX A100 (8 GPU)6.5 kW100-1,0000.7-7 MW
2023DGX H100 (8 GPU)11 kW1,000-10,00011-110 MW
2024GB200 NVL72120 kW10,0001.2 GW
2026Rubin NVL5761 MW10,000-100,00010-100 GW
2028Rubin Ultra NVL5761.5 MW100,000150 GW

单机柜功耗 5 年增长 150×(6.5 kW → 1 MW)。这已接近核反应堆输出功率。

全球 AI 数据中心电力需求(IEA 预测)

年份AI 数据中心 TWh占全球电力同比
202050 TWh0.2%
2023200 TWh0.8%+100%
2025460 TWh1.7%+130%
2026800 TWh2.8%+75%
20281,500 TWh5.0%+90%
20303,000 TWh9.5%+100%

2030 年 AI 数据中心将占全球电力 9.5%(vs 2020 的 0.2%)。这是全球电力转型的核心驱动力

主要 AI 公司电力消耗

公司2024 电力2026 (E)2028 (E)
Microsoft (OpenAI)5 TWh15 TWh40 TWh
Google (Gemini)4 TWh12 TWh35 TWh
Meta (Llama)3 TWh8 TWh25 TWh
Amazon (AWS + Anthropic)6 TWh20 TWh50 TWh
xAI (Grok)1 TWh8 TWh25 TWh
Oracle (OCI)0.5 TWh3 TWh10 TWh
合计~20 TWh~70 TWh~200 TWh

OpenAI 单独计划到 2028 年需要 40 TWh/年——超过瑞典全国年用电量(~35 TWh)。

三大电力危机

危机 1:数据中心电力供应不足

美国情况

  • 2025 北弗吉尼亚(全球最大数据中心集群):电力申请需要等待 3-5 年
  • 德州 Round Rock(Oracle 总部):电网容量已满
  • PJM 电网(美国最大区域电网):2026-2030 缺电 5-10 GW

中国情况

  • 内蒙古、贵州(政府补贴数据中心):部分限电
  • 北京、上海(一线城市):PUE 1.4 以下才批准新建
  • 数据中心电力配额2025 末已用完 60%

欧洲情况

  • 荷兰阿姆斯特丹(MSFT 投资区):暂停新数据中心审批
  • 爱尔兰都柏林(AWS 欧洲总部):2030 前不再批准
  • 北欧(挪威、瑞典、芬兰):可再生能源丰富但容量有限

危机 2:电力成本飙升

地区2020 工业电价2025 工业电价涨幅
美国(弗吉尼亚)$0.05/kWh$0.08/kWh+60%
德国$0.18/kWh$0.35/kWh+94%
英国$0.20/kWh$0.40/kWh+100%
日本$0.18/kWh$0.30/kWh+67%
中国(西部)$0.04/kWh$0.06/kWh+50%

欧洲电价 2 年翻倍——这是 AI 公司向美国/中东迁移的原因之一。

危机 3:碳排放与 ESG 压力

  • 2025 全球数据中心碳排放~150 Mt CO2(百万吨)
  • 2028 (E)~400 Mt CO2(超过德国全年)
  • ESG 基金:越来越多要求"100% 可再生能源"数据中心

应对方案:核能复兴

1. 核电重启

美国 TVA + Microsoft 合作

  • 2025-10 协议:Microsoft 重启 Three Mile Island Unit 1 核电站(840 MW)
  • 2028 投产:专属供电 Microsoft 数据中心
  • 20 年合同:835 MW 全部由 Microsoft 消纳

Amazon + Talen Energy 合作

  • 2025-03 协议:Amazon 收购 Talen Energy Susquehanna 核电站 960 MW 数据中心园区
  • 960 MW 全部供电 AWS
  • 首个核电直供数据中心

Google + Kairos Power(小型模块化反应堆 SMR)

  • 2025-05 协议:500 MW SMR 供电 Google 数据中心
  • 2030 首批:500 MW
  • 2035 总计:500 MW × N 模块

2. 小型模块化反应堆(SMR)

SMR(Small Modular Reactor) 是 AI 数据中心的终极方案

项目传统核电站SMR
单机容量1,000-1,600 MW50-300 MW
建设周期7-10 年3-4 年
投资$10B+$1-2B
灵活性高(可扩容)
安全更高(被动安全)
选址严格灵活(工厂化制造)

主要 SMR 供应商

厂商型号容量2026 状态主要客户
NuScaleVOYGR77 MW 模块2027 首批UAMPS(取消)、罗马尼亚
Rolls-RoyceUK SMR470 MW2030 首批英国政府
TerraPowerNatrium345 MW2030 首批Bill Gates + Warren Buffett
X-energyXe-10080 MW 模块2028 首批Amazon + Energy Northwest
Kairos PowerKP-FHR140 MW 模块2030 首批Google + TVA
HoltecSMR-160160 MW2029 首批多家美国电力公司
CNNC 中国核电HTR-PM250 MW 模块2023 已并网中国山东

CNNC HTR-PM 2023 已并网,是全球首个商用 SMR——比美国 SMR 早 4-5 年。

3. 其他清洁能源

太阳能 + 储能

  • 2025 全美最大太阳能项目Sunlight Captive 1.4 GW(德州)+ 700 MWh 储能
  • Microsoft / Google / Amazon 都签 PPA(电力购买协议)
  • 局限:夜间 / 阴天不稳定,储能成本高

地热

  • Google + Fervo Energy(2025-11):150 MW 地热供电内华达数据中心
  • 2028 计划:500 MW
  • 优势:24/7 稳定供应

风电

  • Amazon + Avangrid(2025):足够 1.5 GW 风电供电德州数据中心
  • 局限:间歇性

4. 自然冷却 + 液冷

降低数据中心 PUE(Power Usage Effectiveness) 也是关键:

冷却方式PUE适用地区
液冷(DLC)1.05-1.15任何地区
间接蒸发冷却1.15-1.25寒冷地区
传统风冷1.4-1.6任何地区
自然冷却(北欧)1.02-1.05寒冷地区

液冷 PUE 1.05-1.15 vs 风冷 1.4-1.6——节能 25-40%。NVIDIA Rubin NVL576 必需液冷。

主要 AI 数据中心案例

1. xAI Colossus(Memphis, Tennessee)

  • 2024-09 启用100,000 颗 H100
  • 单集群功耗~200 MW
  • 特殊供电12 个移动天然气涡轮(临时方案)
  • 争议:环境抗议、空气污染

2. Microsoft + OpenAI Stargate

  • 2025-01 宣布$100B 投资 5 年
  • 首期园区德州 + 亚利桑那
  • 总规划5 GW(相当于 5 个核反应堆)
  • 能源方案:核电 + 太阳能 + 储能混合

3. Amazon Project Rainier

  • 2024-12 启用Anthropic 专用
  • Trainium 2 集群1,000,000 颗 Trainium 2 芯片
  • 总功耗:~300 MW
  • 能源:100% 无碳能源(核电 + 风电)

4. Meta Hyperion(Louisiana)

  • 2025-2027 建设2 GW 数据中心园区
  • 专供电厂Meta + Entergy 合作 1.5 GW 天然气 + 风电
  • 2027 投产:Llama 5 训练

5. Google 数据中心扩张

  • 2025-2026 新建 8 个数据中心
  • 总规划~3 GW 额外容量
  • 能源:100% 无碳(2025 末已实现)
  • 特殊项目:SMR 500 MW + 地热 150 MW

6. Huawei CloudMatrix 384 Ultra

  • 中国国内贵州、内蒙古集群
  • 电力来源西部水电 + 风电(绿能)
  • 功耗:~50 MW / 集群

绿色 AI 战略

1. 能效优化

  • FP4 / FP8 量化:相比 FP16 减少 50% 功耗
  • Sparse 算力:2:4 稀疏减少 50% 算力
  • 液冷:降低 PUE 25-40%
  • 模型压缩:MoE、Distillation、Pruning

2. 可再生能源承诺

公司100% 可再生目标
Google2025 已实现 100% 匹配
Microsoft2030
Amazon2030(2025 达 90%)
Meta2030
Apple2030(2025 已 90%)
Huawei2030("碳中和"目标)
xAI未承诺
Oracle2030

3. 碳捕获与封存

  • Microsoft + Occidental(2025-09):$10B 投资碳捕获
  • Amazon + CarbonCapture Inc.(2025-11):100 MW DAC(直接空气捕获)
  • Google + Climeworks(2025-08):DAC + 储能混合项目

未来展望

短期(2026-2027)

  • AI 电力紧缺加剧:需求增长 50% / 供应增长 15%
  • 电价持续上涨:美国 +30% / 欧洲 +20%
  • 核电重启加速:Microsoft、Amazon、Google 主导
  • SMR 投资激增:2026 全球 SMR 投资 $50B+

中期(2027-2030)

  • HBM 内存 + 核能电力 = AI 算力两大瓶颈
  • SMR 大规模部署:2028 首批商用,2030 达 10+ GW
  • 碳中和数据中心成标配
  • AI 算力向核电资源区迁移:德州、田纳西、加拿大

长期(2030+)

  • 聚变能商业化:Helion / TAE / Commonwealth Fusion 2030+
  • 太空太阳能:理论 24/7 供电
  • 量子计算辅助:降低 AI 算力需求

详细产品页

总结

AI 算力的「下一战场」是电力

  1. 单机柜功耗突破 1 MW(Rubin NVL576)——接近核反应堆
  2. 全球 AI 数据中心 2026 需 800 TWh——超过德国全国
  3. 核电重启:Microsoft / Amazon / Google 各锁定 1-2 GW 核电
  4. SMR 兴起:2028 首批商用,单机 50-300 MW
  5. 可再生能源:太阳能 / 风电 / 地热 / 水电 + 储能
  6. 液冷成标配:PUE 1.05-1.15 vs 风冷 1.4-1.6

没有电力的 AI 算力,就是空中楼阁