深度文章

✨ Kimi K2.5 技术报告摘要:开源多模态代理模型

✨ Kimi K2.5 技术报告摘要:开源多模态代理模型

发布日期: 2026.01.31
报告概要:

Kimi K2.5 是 Moonshot AI 基于 Kimi K2 构建的最强大的开源多模态代理模型。它通过持续预训练约 15 万亿视觉和文本混合 Token 而成,并在多模态和代理群执行方面表现卓越,旨在与顶尖闭源模型竞争。

模型概述与架构

Kimi K2.5 基于 Transformer MoE 架构,支持图像、视频(实验性)和文本输入,具有 256K 的长上下文能力。

参数
总参数 1T
激活参数 32B
层数 61
上下文长度 256K
视觉编码器 MoonViT (400M 参数)

关键创新:自导代理群 (Agent Swarm)

该模型引入了自导代理群(Agent Swarm)机制,最多可达 100 个子代理并行执行 1500 个工具调用,比传统单代理串行执行快 4.5 倍。它使用 PARL (Parallel Agent Reinforcement Learning) 训练,并能通过动态分解任务来避免串行崩溃,支持生成长达 10k 字的输出。

卓越的多模态和办公生产力

Kimi K2.5 在以下专业场景中展示了其能力:

  • **视觉编码:** 从图像/视频生成前端界面、调试代码。
  • **办公任务:** 处理 Word 标注、Excel 透视表和 PDF LaTeX 等 Office 任务。

性能基准

Kimi K2.5 在多项基准测试中得分领先于开源模型,并与顶尖闭源模型竞争:

基准测试 性能指标 相对表现
SWE-Bench Verified (代码修复) 76.8% 领先开源模型
MMMU-Pro (通用多模态) 78.5% 表现出色
BrowseComp (代理群) 78.4% Agent Swarm 的卓越性能
AIME 2025 (推理) 96.1% 与 GPT-5.2、Claude 4.5 竞争
内部基准 (AI Office) 比 K2 提升 59.3% 内部任务性能显著提升