美团开源 LongCat-Flash-Thinking-2601:工具调用能力登顶开源 SOTA
2026-06-15 21:27:00
6 月 15 日,美团 LongCat 团队正式发布并开源 LongCat-Flash-Thinking-2601,号称全球首个完整开源且支持在线免费体验「重思考模式」的模型。
核心能力
- 工具调用 SOTA:τ²-Bench 88.2 分,VitaBench 29.3 分
- 8 路并行推理单元 同时运转,保障复杂决策可靠性
- 在需要新工具接入的随机复杂任务中表现优于 Claude,降低应用侧训练成本
开源地址
- GitHub:meituan-longcat/LongCat-Flash-Thinking-2601
- Hugging Face / ModelScope 同步上线
- API 开放平台:longcat.chat
行业意义
在 Agent 竞争从「聊天」转向「工具调用」的 2026 年,LongCat 将 重思考 + 工具泛化 作为开源差异化方向,为国内企业提供可私有化部署的 Agent 基座选项。