Rio 3.5 技术规格解读:SwiReasoning MoE 与 101 万 Token 上下文

2026-06-16 03:00:00

Rio 3.5 Open 397B 模型卡公布的技术规格(待独立验证):

架构

  • 397B 总参数 / 17B 激活 Mixture-of-Experts
  • 基座:Qwen/Qwen3.5-397B-A17B
  • 上下文:1,010,000 Token

SwiReasoning

可在 显式推理潜空间推理 间动态切换,平衡准确率与效率——类似多家 2026 年旗舰模型的「思考模式」开关。

能力宣称

  • Agent 编程、数学、STEM、多模态基准 开源领先
  • 多语言:葡萄牙语、英语、中文及数十种语言

部署现实

完整权重约 807GB,需多节点 GPU 集群;普通团队更适合评估 量化版/API 或等待社区蒸馏。

建议

在 Nex 争议未澄清前,生产环境应 暂缓默认依赖,但可作为 MoE 长上下文架构的 研究参考样本