Kimi K2.5 是 Moonshot AI 基于 Kimi K2 构建的最强大的开源多模态代理模型。它通过持续预训练约 15 万亿视觉和文本混合 Token 而成,并在多模态和代理群执行方面表现卓越,旨在与顶尖闭源模型竞争。
Kimi K2.5 基于 Transformer MoE 架构,支持图像、视频(实验性)和文本输入,具有 256K 的长上下文能力。
| 参数 | 值 |
|---|---|
| 总参数 | 1T |
| 激活参数 | 32B |
| 层数 | 61 |
| 上下文长度 | 256K |
| 视觉编码器 | MoonViT (400M 参数) |
该模型引入了自导代理群(Agent Swarm)机制,最多可达 100 个子代理并行执行 1500 个工具调用,比传统单代理串行执行快 4.5 倍。它使用 PARL (Parallel Agent Reinforcement Learning) 训练,并能通过动态分解任务来避免串行崩溃,支持生成长达 10k 字的输出。
Kimi K2.5 在以下专业场景中展示了其能力:
Kimi K2.5 在多项基准测试中得分领先于开源模型,并与顶尖闭源模型竞争:
| 基准测试 | 性能指标 | 相对表现 |
|---|---|---|
| SWE-Bench Verified (代码修复) | 76.8% | 领先开源模型 |
| MMMU-Pro (通用多模态) | 78.5% | 表现出色 |
| BrowseComp (代理群) | 78.4% | Agent Swarm 的卓越性能 |
| AIME 2025 (推理) | 96.1% | 与 GPT-5.2、Claude 4.5 竞争 |
| 内部基准 (AI Office) | 比 K2 提升 59.3% | 内部任务性能显著提升 |