大型挂机现场：马斯克的55万英伟达GPU，利用率才11%

作者: 机器之心 2026-05-05

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

xAI

编辑 | 泽南

AI 时代堆 GPU，原来是这么个堆法？

马斯克旗下的 xAI 目前 GPU 资源利用率只有大概 11%。相关报告指出，其 AI 软件栈的优化效果不尽如人意。近日，《The Information》的报道引发了人们的关注。

xAI

目前，xAI 在其 Memphis 和 Colossus 数据中心集群中运营着约 55 万块英伟达 GPU，包括 H100 和 H200 两种型号，其中部分设备采用了液冷散热配置。尽管这些 GPU 属于上一代产品（早于最新的 Blackwell 系列），但其规模已经令人叹为观止。

拥有如此庞大的 GPU 存量，xAI 的模型算力利用率（MFU，Model FLOPs Utilization）却只有 11%。打个不恰当的比喻，在 xAI 服务器中已安装的这 50 万块 GPU 中，实际可用的算力仅相当于约 6 万块 GPU 的水平。究竟是什么原因导致了如此低的效率？

首先，对于较小规模的部署环境（例如 1000-10000 块 GPU）而言，多节点之间的协调计算通常不成问题。但随着服务器规模的不断扩大，当需要集成数十万颗 GPU 时，设备的空闲时间便会迅速累积，导致整体利用率急剧下滑。由此引发的软件栈内部的一系列不一致性问题，目前正在 xAI 的实际运行中暴露无遗。

在超级集群中，GPU 芯片本身的计算速度相对很快，瓶颈在于高带宽内存（HBM）的数据读写速度和成千上万台服务器之间网络传输的通信开销。只要数据传输出现微小的延迟或网络拥堵，整个集群的 GPU 就会被迫 “原地挂机” 等待数据加载。

另一方面，AI 模型的训练通常是间歇性的。GPU 在实际计算时满载运转，但在研究人员分析训练结果、调整参数或处理数据管道时，大量设备就会处于闲置（Idle）状态。

虽然 11% 是一个显然偏低的数字，但 The Information 的报道也揭示了 AI 领域的一些行业潜规则：算力浪费是普遍的现象，有些大厂的研究人员为了避免被管理层批评，或者害怕闲置的 GPU 配额被其他团队抢走，甚至会故意重复运行一些无意义的训练任务来 “刷高” 利用率数据。

该说不说，这么做也是为了保住团队自己的 GPU 配额。

当然，这并非 xAI 独有的难题，它实际上是整个 AI 行业普遍存在的一种结构性问题 ——AI 基础设施要在如此庞大的规模下实现高效运行，是一项极其艰巨的挑战。

xAI

运行 AI 云基础设施所需的优化技能涵盖数据、算法、模型、计算、内核、交互（人类 - AI - 世界、智能体之间），以及全局优化，在工程上难度极高。

一些科技巨头着重优化了大规模基础设施堆栈，已经能够实现超过 40% 的利用率。Meta 和谷歌便是此类典范，其 GPU 的利用率分别高达 43% 和 46%。

xAI 遇到的困境证明了在当前的 AI 军备竞赛中，“买到 GPU” 只是第一步，用好才是关键。硬件规模已经超出了现有软件架构的调度能力。

不过，xAI 已在着手解决这一问题，并设定了利用率达到 50% 的目标。尽管目前尚无确切的时间表，但其核心改进将聚焦于基础设施与软件堆栈的优化。随着未来工作负载逐步迁移至那些专为驱动 “智能体 AI”（Agentic AI）需求而设计的硬件平台之上，xAI 极有可能将其庞大的 GPU 集群对外提供租赁服务。

马斯克也在寻求转变，押注于自研算力的 “TeraFab” 项目：一方面，他正在推动多款自研芯片，将其纳入 xAI 的 “AI 芯片家族” 之中；另一方面，马斯克也希望借助英特尔的 14A 制程技术，为未来的 xAI、SpaceX 及其它相关业务打造尖端解决方案。

xAI 的困境提醒了所有追赶者：AI 竞赛的下半场，拼的可能不再是谁能买到更多显卡。

参考内容：

https://www.theinformation.com/newsletters/ai-agenda/xai-shows-hard-use-lot-gpus

本文来自微信公众号 “机器之心”（ID：almosthuman2014），作者：关注AI基础设施的

稳定币与拉美汇款：被误读的 1740 亿美元市场

对话PWL Capital首席投资官：十大常见理财误区，你中了几招?

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

去中心化身份验证协议 KGeN 完成 1,350 万美元战略融资，Jump Crypto、Accel 和 Prosus Ventures 领投

火星财经消息，去中心化身份验证协议 KGeN 完成 1,350 万美元战略融资，由 Jump Crypto、Accel 和 Prosus Ventures 领投，使其总融资额达到 4,350 万

2025-10-01 09:29:02
美联储戴利：劳动力市场疲软前秋季降息更合适，经济基本面朝向降息发展

火星财经消息，据金十报道，美联储官员戴利表示，除非看到劳动力市场出现疲软，否则秋季降息似乎更为合适。他指出，经济基本面正朝着可能需要降息的方向发展，公司CEO对关税持谨慎乐观态度，而其他可能的关

2025-06-21 08:01:00
赵长鹏：不要高买低卖

火星财经消息，币安创始人赵长鹏在社交平台发文表示，“不要高买低卖。”

2025-03-11 19:08:02
Binance将下架QI、TLM以及VITE的BTC交易对

火星财经消息，2 月 4 日，据官方公告，经过审查后，Binance 将于 2 月 6 日 11:00 (北京时间) 下架 QI/BTC、TLM/BTC、VITE/BTC。

2025-02-04 15:06:03
HyperFND官方X账户已恢复安全，链上系统与其他渠道未受影响

火星财经消息, 据@HyperliquidX 发布，此前遭入侵的 HyperFND 官方 X 账户已完成安全恢复。Hyperliquid 区块链及其其他社交平台账号未受到任何影响，始终保持安全。

2025-05-26 12:28:02
数据：美股市值集中度创纪录新高，前10%股票占据股市总价值78%

火星财经消息，9 月 27 日，交易资讯平台 Kobeissi Letter 发布数据：当前美国市值排名前 10% 的股票占据了美国股市 78% 的市值，该比例创历史新高。较上世纪 30 年代创

2025-09-27 01:58:00
Ripple CEO：NCA研究显示21%的美国人持有加密货币

火星财经消息，4 月 3 日，Ripple 首席执行官 Brad Garlinghouse 发文披露，在美国有史以来规模最大的加密货币研究中，NCA（National Cryptocurrenc

2025-04-03 08:02:01
伊万卡·特朗普：加密货币 $IVANKA 与我没有任何关系

火星财经消息，特朗普女儿伊万卡·特朗普在个人推特发文表示，有人在未经我同意或批准的情况下推广一种名为“Ivanka Trump”或“$IVANKA”的假加密货币。需要说明的是：我与这种加密货币没

2025-01-24 02:29:39

OKX欧易app

欧易交易所app是全球排名第一的虚拟货币交易所，注册领取6万元盲盒礼包!

APP下载官网注册

币种	价格	涨跌幅
BTC 比特币	￥780,779.71 $109,400.40	-0.3%
ETH 以太坊	￥28,519.55 $3,996.07	-1.19%
USDT 泰达币	￥6.50 $0.91130	-5.75%
SOL Solana	￥1,445.15 $202.49	+1.27%
BNB 币安币	￥6,915.37 $968.96	+1.59%
XRP 瑞波币	￥6.50 $0.91130	-5.75%
DOGE 狗狗币	￥1.64 $0.22965	-0.39%
USDC USD	￥7.13 $0.99940	+0.02%
ADA 艾达币	￥5.61 $0.78600	+1.87%
AVAX Avalanche	￥204.61 $28.67	-1.51%
TRX 波场	￥6.50 $0.91130	-5.75%
TON Toncoin	￥19.44 $2.72	+2.14%
SHIB Shiba	￥0.00019 $0.0000260	+5.78 %
XLM 恒星币	￥2,75 $0,38580	-0.85%
DOT 波卡币	￥60.21 $8.31	+2.4 %
LINK ChainLink	￥148.80 $20.85	-0.33%
OKB OK币	￥1,351.87 $189.42	+1.69%
BCH 比特现金	￥6.50 $0.91130	-5.75%
SUI Sui	￥25.56 $3.53	+4.94 %
PEPE Pepe	￥0.0000660 $0.0000093	-1.28%