欢迎加入宝宝计划-计划之家-软件官网下载社区

华为发布UCM推理技术共享架构,助力国产AI推理生态升级

华为发布UCM推理技术共享架构,助力国产AI推理生态升级
华为8月12日正式发布AI推理创新技术UCM(推理记忆数据管理器)。据了解,作为一款以KVCache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KVCache记忆数据,可扩大推理上下文窗口,实现高吞吐、低时延的推理体验,降低每Token推理成本。华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。
  • 发表于 2025-08-12 01:34
  • 阅读 ( 7207 )
  • 分类:收藏

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
电脑排行
电脑排行

1 篇文章

作家榜 »

  1. 僵局热 79 文章
  2. 易水寒 72 文章
  3. 天王山之战 23 文章
  4. 爱旅行的小狗 21 文章
  5. 找适合自己的路 19 文章
  6. 多情歌 15 文章
  7. 寻找一条活路 7 文章
  8. 丁字裤 7 文章