Rio 3.5 技术规格解读:SwiReasoning MoE 与 101 万 Token 上下文
2026-06-16 03:00:00
Rio 3.5 Open 397B 模型卡公布的技术规格(待独立验证):
架构
- 397B 总参数 / 17B 激活 Mixture-of-Experts
- 基座:Qwen/Qwen3.5-397B-A17B
- 上下文:1,010,000 Token
SwiReasoning
可在 显式推理 与 潜空间推理 间动态切换,平衡准确率与效率——类似多家 2026 年旗舰模型的「思考模式」开关。
能力宣称
- Agent 编程、数学、STEM、多模态基准 开源领先
- 多语言:葡萄牙语、英语、中文及数十种语言
部署现实
完整权重约 807GB,需多节点 GPU 集群;普通团队更适合评估 量化版/API 或等待社区蒸馏。
建议
在 Nex 争议未澄清前,生产环境应 暂缓默认依赖,但可作为 MoE 长上下文架构的 研究参考样本。