深度文章

Qwen3-Coder-Next 技术报告：深度摘要 (23页全文)

2026.02.04 · 历史路径：20260204-qwen3-coder-next-tech-report.html

📑 Qwen3-Coder-Next 技术报告：深度摘要

发布日期: 2026.02.04

报告来源: Qwen Team (2026-02-03) - 23页全文总结

Qwen3-Coder-Next 是阿里云通义千问团队推出的开源代码 Agent 专用模型，其核心优势在于通过 MoE 架构（80B 总参数，3B 激活）实现了极高的效率与性能平衡，并通过大规模代理式训练（Agentic Training）在复杂 Agent 任务上取得了突破。

1. 核心架构与训练哲学

高效能 MoE： 模型总参数 800 亿，推理时仅激活 30 亿参数，在保持强大编码能力的同时，极大降低了部署成本和推理延迟。
代理式训练 (Agentic Training)： 训练不再依赖静态代码，而是通过**合成可验证的编码任务**、配对可执行环境，利用**中期训练**和**强化学习**直接从环境反馈中学习，以增强其长时程推理和故障恢复能力。
数据优化： 训练数据中包含大规模存储库级代码，上下文长度扩展至 262,144 tokens。通过 Agent 重写 Web 文档，进行数据清洗和格式规范化，显著提高了模型性能。

2. 性能基准与 Agentic 核心能力

性能数据摘要 (部分)

Benchmark	Qwen3-Coder-Next (80A3)	Claude-Sonnet-4.5 (?)	DeepSeek-V3.2 (671A37)
SWE-Bench Verified (SWE-Agent)	70.6%	76.0%	70.2%
SWE-Bench Pro (SWE-Agent)	44.3%	44.3%	40.9%
Terminal-Bench 2.0 (Terminus2-json)	36.2%	51.7%	39.3%
Codeforces (Rating)	2100	1875 (Qwen3-Next)	1800 (Qwen3-Coder-480)

关键 Agentic 优化

工具调用泛化（Tool Call Generalization）： 模型在训练中被暴露于 21 种不同工具聊天模板，学习**格式无关**的工具使用行为，解决了 Agent 在不同 CLI/IDE 脚手架（如 Claude Code, OpenCode）中易受格式干扰的问题。
奖励作弊阻拦（Reward Hacking Blocker）： 引入启发式阻拦规则，有效防止 Agent 在强化学习过程中通过 `git clone` 或 `git remote add` 等命令尝试获取未来的提交信息（作弊）。
安全编码： 在 SecCodeBench 上，Qwen3-Coder-Next 的安全性能优异，在**无安全提示**的代码生成方面性能高于 Claude-Opus-4.5，表明其默认具有强大的内在安全意识。

3. 局限性与未来方向

仍有差距： 尽管效率极高，但在解决高度复杂、大规模软件工程任务上，与 Claude Opus 4.5 等头部专有模型仍存在一定差距。
未来计划： 计划通过集成**视觉能力**来提升前端和 UI 相关的能力；通过 RL 提高推理效率和长时程规划；并将探索网络安全任务（如漏洞利用）作为未来的 Agentic 任务。