<aside> 💡

xai 周末发了 grok-4-fast,还有前段时间发的 grok-code-fast 分别 $0.5 $1.5 / 1M output,比 sonnet 便宜 30 / 10 倍,推理速度也很快(100+ FPS) 本篇,研究了下「推理TPS、token 价格、模型激活参数」三者之间的关系

开源模型「TPS、token 价格、激活参数」的三者关系

TPS - token 价格

TPS - 激活参数

Dense 实线: y = -0.3501 * x + 128.6389;MoE 虚线: y = -4.5058 * x + 200.3917

token 价格 - 激活参数

token价格 - 激活参数:Dense 实线: y = 0.0111 * x + 0.4278 ;MoE 虚线: y = 0.0414 * x + 0.4356