LongCat「重思考」架构:8 路并行推理单元如何提升工具调用可靠性

2026-06-15 21:45:00

LongCat-Flash-Thinking-2601 的核心创新是 「重思考(Heavy Thinking)」模式——区别于单次 CoT,模型可 并行启动 8 个推理单元,综合多路径结论后再行动。

评测表现

基准 分数 说明
τ²-Bench 88.2 智能体工具调用
VitaBench 29.3 多领域工具场景

工具泛化

在需要 随机接入新工具 的复杂任务中,表现优于 Claude——意味着应用侧 少样本/零样本工具绑定 成本更低。

开放策略

  • 完整权重开源(GitHub / HF / ModelScope)
  • 在线免费体验 重思考模式(首个完整开源且免费的同类模型)
  • API 开放平台同步

适用场景

企业 Agent 平台、自动化运维、跨系统工具编排等 长链路工具调用 场景可重点评估。