算苗科技 3D TokenPU 芯片 A4E 流片成功:国产大模型推理算力新突破

2026-06-19 10:30:00

算苗科技6 月 19 日 宣布 3D TokenPU 芯片 A4E 完成 流片——国产 3D 混合堆叠 AI 推理芯片 重要节点。

技术亮点

维度 说明
3D 混合堆叠 垂直堆叠提升带宽与算力密度
Tile-Native 硬件原生 Tile 调度 + 多精度动态切换
软件栈 适配 LLVM、Triton 等开源生态
目标场景 大模型 Token 推理(一次搬运、多次复用)

产业意义

  • 中国 首次 基于 国产供应链 的 3D 堆叠 AI 芯片量产路径
  • 降低大模型推理 TCO(总拥有成本)
  • 昇腾、平头哥 等形成 多元国产算力 供给

资本

投资方包括 国开金融、北京顺禧、源码资本 等——涵盖国资、市场化基金、产业资本。

对软件行业

  • 私有化部署 DeepSeek/Qwen/GLM推理成本 有望下降
  • 云厂商、政企 信创算力 多一个 架构创新选项
  • 需关注 量产进度、框架适配、Benchmark 公开数据

趋势

2026 年国产 AI 竞争从 「堆参数」 转向 「架构创新 + 供应链自主」