上周跟我在俄勒冈州做数据中心运维的发小通越洋电话,他说xAI的集群值守团队最近扩招了一倍,三班倒连轴转,休假申请全被打回。之前大家都以为是Grok 2赶进度,直到上周爆料出来,闲时大半算力都给了Anthropic跑Claude。这事听着真魔幻。
把对手当供货商,xAI算盘打得震天响
The Information上周的独家爆料里提到,Anthropic每月付给xAI十多亿美元的算力费用。没股权投资,没技术交叉授权,就是纯租GPU机时。
这个数字吓了整个硅谷一跳。
xAI今年初说要搭10万张H100的超算集群,目前落地也就几万张,Grok现在的训练推理需求,根本吃不满。发小还说,xAI数据中心门口最近停了辆免费墨西哥卷餐车,夜班随便拿,辣酱还是当地网红店的。图啥?就怕没人愿意熬夜处理集群故障。这帮人真够拼。
光靠出租算力,xAI一年能进账百来亿美元,前期投的超算建设成本,大概两年就能回本。这比苦哈哈打磨C端产品变现快多了。
硅谷媒体没少骂这事。马斯克去年还拉着几百号人签名,呼吁暂停训练比GPT-4更强的模型,转头就给对手卖算力,简直是递刀子。我翻了下他最近的X动态,半个字没提这笔交易,倒是转了好几条Grok 2的测试视频。
算力就是硬通货
顶规大模型训练一次,得万张H100跑上几个月。英伟达H100交货期现在排到大后年,有钱也得干等。Anthropic之前跟亚马逊签了几十亿美元的云服务协议,照样不够用。前阵子Claude用户量暴涨,三天两头卡顿,用户投诉堆成山。
Anthropic的工程师在内部论坛吐槽,加钱找AWS要算力,排期还得等好几个月。实在等不及才找了xAI,没几天集群配额就开出来了。
上个月我跟国内一家大模型公司的算法负责人吃饭,他说他们手里的H100卡得死死的,利用率恨不得拉满,实习生跑个小测试都得走好几层审批。现在国内拿不到最新GPU,不少公司开始大规模用国产芯片,适配优化得花大功夫,但至少不用看人脸色排队。
以前苹果三星在手机市场打得头破血流,苹果照样每年给三星交几十亿采购屏幕闪存。竞合在科技圈不新鲜,但算力直接决定模型迭代,这回的敏感程度高多了。
发小在电话最后跟我说:“我值夜班看后台任务标签,一半标着Grok,一半标着Claude,机房里的灯亮得晃眼。”说完他那边墨西哥卷餐车的发电机响了,就挂了。