美国当地7月9日晚,xAI正式发布最新的大模型Grok 4。根据Artificial Analysis对比,Grok 4 综合分数达73 分,超越OpenAI o3-pro(71 分)和谷歌Gemini 2.5Pro(70 分),成为当前性能最强的AI 模型。Grok 4 反映AI 大模型的迭代持续,更大规模的算力集群仍是趋势,对扁平化、低延迟的网络也形成新需求。
Grok 4 具备推理、多模态、网络搜索、语音等多种能力,在多项基准测试中领先。Grok 4 类似Grok 3 支持256k tokens 的上下文窗口,配备DeepSearch工具,具有实时网络访问能力。Grok 4 还是xAI 首个具备图文多模态能力的大模型,语音功能也进一步优化;发布会对Grok 4 与ChatGPT 的语音功能进行现场对比,Grok 4 的回答速度与语调表现更为突出。此外,xAI 同步推出多智能体(multi agents)Grok 4 Heavy,支持4 个智能体同时工作,在“人类最后考试”(HLE)基准测试中得分达44.4 分,高于Grok 4(38.6 分)、Gemini 2.5 Pro(26.9 分)、o3(24.9 分)。
Grok 4 推出订阅版本加速商业闭环,定价相对更高体现xAI 信心。据xAI 发布会,Grok 4 的订阅费为30 美元/月,多智能体版本的Grok 4 Heavy 的费用为300 美元/月,Grok 3 则维持免费开放,两档订阅费用均高于OpenAI 与Gemini(OpenAI Plus/Gemini Pro 为20 美元/月,OpenAI Pro/Gemini Ultra为200 美元/月)。API 定价上,Grok 4 与Grok 3 一致,即每100 万Tokens输入/输出为3/15 美元,也高于Gemini 2.5 Pro 与OpenAI o3 的定价。
Grok 4 反映Scaling Law 仍然有效,十万卡集群的建设或将是主流趋势。在xAI 20 万张H100 超算集群的算力支持下,Grok 3 预训练(Pre-training)的效果较Grok 2 提升10 倍。尽管Grok 4 预训练的算力与Grok 3 近似,但训练中强化学习(Reinforcement Learning)投入算力是Grok 3 的10 倍。据发布会示意图,Grok 4 强化学习投入算力已超过预训练。因此,尽管预训练规模已趋极限,但更大规模算力投入到强化学习训练中,仍能推动大模型的能力、特别是推理能力的持续提升。集群规模的扩张、数据中心的互联将促进网络架构升级、光互连渗透率提升等趋势,利好光模块、CPO、DCI 等环节。
大模型训练从预训练向强化学习转移的结构下,低延时高速互联通信呈现更高需求。预训练基于静态的大规模数据集,训练核心是“大规模并行计算+海量数据吞吐”,GPU 的吞吐量是训练效率的瓶颈(性能要求:GPU>光模块>交换机)。强化学习的数据实时生成,大模型持续开展“推理-反馈-更新”的探索过程,核心是“闭环反馈+高频参数同步”,需要更扁平化的网络架构,也对交换机和光模块的低延时要求更高(性能要求:交换机>光模块>GPU)。
AI 大模型竞速持续,xAI 下半年拟加速布局AI 生态。根据SimilarWeb 统计,ChatGPT 6 月的周访问量已稳定在12 亿人次,Gemini 的周访问量也从4 月底的1 亿人次增至6 月末的1.5 亿人次;而Grok、Claude 等大模型的周访问量仍在4 千万人次以下波动。随着AI 能力的成熟与用户黏性的养成,大模型的竞争格局已现雏形,各厂商正加大投入、争取成为大模型领域的有力竞争者。xAI 在发布会提出8 月将上线专业编码模型,9 月推出多模态智能体,10月发布视频生成模型,在三个月内实现图文、代码、视频及复杂代理任务AI 的全覆盖。与此同时,OpenAI 已明确GTP 5 将在今年夏季发布;7 月9 日Gemini 3.0 Pro beta 版的名称则在官方GitHub 仓库意外公开,或表明谷歌内部正测试下一代Gemini 3.0 系列模型,有望近期发布。大模型的竞速与迭代持续,算力需求仍将保持旺盛水平。
风险提示:AI 发展不及预期、下游资本开支不及预期、全球贸易摩擦加剧。