LongCat「重思考」架构:8 路并行推理单元如何提升工具调用可靠性
2026-06-15 21:45:00
LongCat-Flash-Thinking-2601 的核心创新是 「重思考(Heavy Thinking)」模式——区别于单次 CoT,模型可 并行启动 8 个推理单元,综合多路径结论后再行动。
评测表现
| 基准 | 分数 | 说明 |
|---|---|---|
| τ²-Bench | 88.2 | 智能体工具调用 |
| VitaBench | 29.3 | 多领域工具场景 |
工具泛化
在需要 随机接入新工具 的复杂任务中,表现优于 Claude——意味着应用侧 少样本/零样本工具绑定 成本更低。
开放策略
- 完整权重开源(GitHub / HF / ModelScope)
- 在线免费体验 重思考模式(首个完整开源且免费的同类模型)
- API 开放平台同步
适用场景
企业 Agent 平台、自动化运维、跨系统工具编排等 长链路工具调用 场景可重点评估。