昇腾从硬件到软件提前布局 迎接Agent时代挑战

3周前 (06-03)热点话题2

  中国大模型能力在过去一年中已经跻身全球第一梯队。MiniMax M2.5、Kimi K2.5的Token消耗量在OpenRouter上长期位居前列,DeepSeek V4也常被拿来与GPT-5对标。这些模型之所以能够运行,是因为现有的算力底座足够强大。

  

  然而,当进入Agent时代时,现有的“够用”可能不再足够。“能跑”和“跑得舒服”是两码事。在今年的鲲鹏昇腾开发者大会上,昇腾指出,过去一年模型调用频次暴涨了50到100倍,序列长度从Chatbot时代的4K飙升至接近1M,相当于250倍的跨度。MoE推理对时延的要求也越来越苛刻,正从10毫秒向1毫秒级别逼近。

  

  这不仅仅是模型变大的问题,而是整个算力底座的底层逻辑需要被重写。真正的问题在于,当Agent的需求以指数级增长时,现有算力架构还能支撑多久?基于这一视角,昇腾今年在峰会上强调了超节点架构创新、软件全面开源开放以及开发者体验升级,旨在让算力底座从“能跑模型”进化到“天然亲和Agent”。

  

  超节点架构使得数千个NPU之间能够更高效地协同工作。在Chatbot时代,序列长度约4K,KVCache命中一次就够,NPU之间的通信压力不大。但进入Agent时代,推理链路拉长到接近1M tokens,KVCache需要跨NPU频繁跳跃。这时,问题不仅在于带宽是否足够,而是如何优化NPU之间的通信。传统方案下,每个NPU挂载独立内存,跨NPU访问要走消息语义,单次通信在微秒级。而昇腾超节点通过灵衢互联协议和总线控制器,实现了全域内存统一编址,使得NPU和CPU可以直接用虚拟地址访问任意位置,无需改代码、无需路由、无需拷贝。此外,通过片上内存和DDR的分层池化能力,查询时延大幅降低,训练和推理吞吐相比传统集群提升3到4倍。昇腾从硬件到软件提前布局 迎接Agent时代挑战

“昇腾从硬件到软件提前布局 迎接Agent时代挑战” 的相关文章

博主:关税战就像美国的“垂死一击”!

  博主:关税战就像美国的“垂死一击”。美国对华加征关税的“垂死一击”,非但未能遏制中国,反而引发自身经济反噬。高盛报告显示,美国GDP增速已跌至0.5%,普通家庭年均多支出超5000美元...

南方人哈尔滨舔冰块 拔下后舌头流血 低温冻粘现象揭秘

  南方人哈尔滨舔冰块 拔下后舌头流血 低温冻粘现象揭秘!2026年1月18日热点话题,一名女孩在哈尔滨旅游时尝试舔冰,结果舌头被牢牢粘在冰面上。她最终通过持续哈气才慢慢脱困,但舌尖已经表...

发改委:将统一两新补贴标准 落实全国统一大市场要求

  国家发展改革委资源节约和环境保护司司长王善成在国新办新闻发布会上宣布,将统一“两新”补贴标准,以落实全国统一大市场的要求。具体措施包括在全国范围内对汽车报废更新、汽车置换更新、六类家电...

辟谣胖东来虚构商品成本被罚 谣言已澄清

  近日,某平台账号“笑熬江湖”发布消息称,许昌胖东来生活广场有限公司因虚构商品成本被许昌市市场监督管理局罚款50万元热点话题。经核实,许昌市发改委和市市场监督管理局均表示,许昌市胖东来商...

上海-6℃要来了 未来还有雪吗 全城追雪乐翻天

  1月20日早上,上海迎来了一场认真的雪。随着中午的临近,雪花越下越大,纷纷扬扬地飘落,给城市带来了独特的冬日氛围。雪花缓缓落在树叶和窗户上,与茶楼古建筑的门头相映成趣。不少市民拍到了经...

王楚钦2025年度话题人物第三 全网热度飙升

  王楚钦在2025年多个平台的搜索榜单上名列前茅,与众多文体政商界人物齐名,甚至在全网热度指数上超过了刘强东和马云。在小红书的搜索指数中热点话题,王楚钦以293.3万的成绩高居榜首,远超...