行情回顾:本周(2025.7.7-2025.7.11)申万计算机行业指数上涨3.22%,在31 个申万一级行业中排名第6 位。截至本周五(7 月11 日),计算机行业指数与较年初上涨9.75%,跑赢沪深300 指数7.72pct。
7 月10 日,xAI 发布新一代大模型Grok 4 系列。Grok 4 系列包括Grok 4 和Grok 4 Heavy 两个版本,Grok 4 为单智能体模型,Grok 4Heavy 为多智能体的升级版,可支持4 个agent 同时工作。Grok 4 系列推理能力大幅提升,在多个基准测试中刷新行业SOTA。
Grok 4 系列在各项专业学科基准测试中表现大幅领先,在知识能力上已经超越研究生水平。在HLE(Humanities Last Exam,由各学科专家编写的高难度学术测试集)测试中,在使用工具的情况下,Grok 4 的成绩为 38.6%,Grok 4 Heavy 的成绩为44.4%,大幅超越o3 和Gemini 2.5Pro。如果在推理阶段增加算力投入并使用工具,则分数进一步提升至50.7%。在AIME25、GPQA、HMMT25 等其他权威基准测试方面, Grok 4 Heavy均超越其他此前最先进的模型夺冠。
Grok 展现出较强的解决复杂现实任务的能力。在衡量复杂任务解决能力的商业环境测试Vending-Bench 中,Grok-4 模拟经营取得的利润是第二名Claude Opus 4 的两倍。在游戏领域,Grok-4 可以设计和构建视频游戏,包括资源获取、写代码等,研究人员用4 个小时制作出一款第一人称射击游戏。此外,Grok 4 在生物医药、金融等领域也取得较大突破。
Grok 4 性能的大幅提升主要来源于算力投入的大幅增长,以及在训练阶段引入工具使用。Grok-4 在xAI 建设的20 万卡集群Colossus 上运行强化学习训练,其训练量是Grok-2 的100 倍、Grok-3 的10 倍。Grok4 Heavy 通过提高强化学习阶段的算力投入以提升模型效果。Grok 4 特别强调了在后训练过程中原生融入工具,比如在“人类最后考试HLE”上,在后训练中融入工具,不仅比不使用工具能取得更高分数,而且Scaling提升效率也更高。即增加同样的计算资源,工具融入训练能带来更高智能。
投资建议:xAI 新发布的模型进一步加强了基座模型能力,有铀貯I 应用落地。重点推荐金山办公、用友网络、赛意信息、熵基科技、云从科技等,AI 应用的发展也会促进基础设施的发展,重点推荐海光信息、智微智能、联想集团等。
风险提示: AI 技术发展不及预期,市场竞争加剧。