| 1 | Google Gemini 3.1 Pro 性能上探,复杂推理与代理任务表现显著提升 | 模型 | 9.8/10 | 头部竞赛进入“工程可用性”阶段 |
| 2 | Anthropic Claude Sonnet 4.6 持续强化企业编码与商业任务稳定性 | 模型 | 9.6/10 | 小体量高效模型更适配企业成本结构 |
| 3 | OpenAI GPT-5.3-Codex 继续押注复杂软件开发与自动化编程链路 | 模型 | 9.5/10 | “AI 写代码”向“AI 交付系统”迁移 |
| 4 | 阿里 Qwen 3.5 面向 Agent 场景迭代,强调多步任务完成率 | 模型 | 9.3/10 | 国内模型从参数战转向任务完成战 |
| 5 | DeepSeek v4 与超长上下文能力持续引发开源生态跟进 | 开源 | 9.2/10 | 长上下文成为企业知识系统关键指标 |
| 6 | 智谱 GLM-5 工程化定位清晰,Agentic Engineering 路线强化 | 模型 | 9.0/10 | 国产大模型进入“可运维、可集成”阶段 |
| 7 | NVIDIA 被曝推进对 OpenAI 的超大额投资安排 | 融资 | 8.9/10 | 算力+模型的垂直协同进一步加深 |
| 8 | Anthropic 预 IPO 融资传闻升温,资本继续押注头部闭源模型 | 融资 | 8.8/10 | 资金向“稳定商业化能力”集中 |
| 9 | OpenAI 新一轮融资规模预期继续上修,估值天花板再被讨论 | 融资 | 8.8/10 | 基础模型赛道呈现强者恒强 |
| 10 | MiniMax M2.5 系列以“高性价比”切入高端能力区间 | 模型 | 8.7/10 | 价格战将倒逼应用层爆发 |
| 11 | 中国网络与 AI 治理条款进入执行期,合规门槛上升 | 监管 | 8.6/10 | “先合规后规模”成为企业默认路径 |
| 12 | 美国州级 AI 法规持续落地,前沿模型开发责任边界更明确 | 监管 | 8.5/10 | 跨州合规将提高出海复杂度 |
| 13 | 英国金融监管系统关注 AI 应用风险,金融场景落地节奏趋审慎 | 监管 | 8.3/10 | 高监管行业更重可解释与审计 |
| 14 | 国资体系“AI+”推进,算力与行业大模型投资预期增强 | 监管 | 8.2/10 | 政企市场将成下一轮增量主战场 |
| 15 | Ai2 等机构推进开源编码代理,开发者工具链加速重构 | 开源 | 8.1/10 | “IDE + Agent”正替代传统插件思路 |
| 16 | Kimi K2.5 等开源能力继续扩散,多模态训练门槛下探 | 开源 | 8.0/10 | 多模态将从演示走向标准功能 |
| 17 | NVIDIA 开源推理与部署工具生态持续扩大(TensorRT-LLM 等) | 开源 | 7.9/10 | 推理优化成为成本竞争核心 |
| 18 | SoftBank AI-RAN 编排组件开源,AI 与通信基础设施融合提速 | 开源 | 7.8/10 | 边缘侧 AI 资源调度价值上升 |
| 19 | 拉美等区域模型(如 Latam-GPT)推进本地语料与文化适配 | 模型 | 7.7/10 | “区域主权模型”会长期存在 |
| 20 | xAI Grok 4.20 等新模型动态持续,次头部厂商加速追赶 | 模型 | 7.5/10 | 竞赛节奏继续维持高频发布 |