Takeaway

Grok 系列模型规格

表中,计算量预计值置信度较高(i.e. 多种方式交叉验证),模型大小 & 数据量为合理推算

计算公式:FLOPs ≈ 芯片算力训练时长MFU ≈ 6ND(未考虑 longCT 长序列训练)

时间 (按月) 版本(模型大小 & 数据量) 计算量预估 GPU 规模 训练集群 关键节点
2023 3 xAI 成立
2023 6 – 2023 10 Grok‑1(开源)
大小 314B-86A
数据 ~ 10T ~ 5e24 FLOPs (MFU ~ 20%) ~ 8k A100 Oracle Cloud - xAI 使用 JAX 库和 Rust 语言,用自定义的训练栈从头开始训练 xAI

计算集群规模拆解

2025年,最大集群的规模 200k H(xAI colossus),100k GB200(OpenAI Stargate,以 FP8 算力换算 等效 250k H)

2026年,多个 200k GB200 预计会上线

xAI Colossus 集群:150k H100 + 50k H200(同一AZ,300MW,液冷)

xAI 未来集群规划