中国芯“混编”战力全开!上海AI实验室新技术破算力瓶颈,沐曦壁仞等均适配

1个月前 (03-20)财经热点3

  (AI)加速演进,社会对高质量、低成本算力的需求持续攀升,但如何整合不同品牌、不同架构(即“异构”)的

  记者从上海实验室(上海AI实验室)获悉,他们近日正式发布DeepLink混合推理方案,率先实现多元异构芯片的深度混合调度与协同推理。这也是该实验室继去年率先攻克混合训练的难题后,在构建我国自主可控、高效协同的算力底座上,再次取得的标志性突破。

  随着AI大模型应用的普及,社会当前的算力需求正逐渐从训练转向推理。简单说,如果大模型的“训练”是它们在研发阶段“寒窗苦读、习得知识”,那么“推理”就是它们“学成”后步入社会、为千行百业解决具体问题的过程。当前,伴随AI应用的爆发,全社会对推理算力的需求,正呈几何级增长。

  然而,此前国产算力推理技术,只能支持单一型号芯片的算力调度。由于各芯片厂商缺乏互联互通的标准,因此异构芯片间调度难、利用率低,难以形成合力。如何突破这一“算力围城”,成为加速AI全面赋能各行各业的关键。

  “AI模型的推理,其实像是一场足球赛。”上海AI实验室专家工程师、系统平台中心负责人王辉告诉记者,用单一芯片建设的算力集群,就像是一支由“11个前锋”或“11个后卫”组成的球队,虽然单兵素质挺优秀,但由于位置单一、功能重复,面对复杂赛况却往往难以发挥最大效能。

  实际上,模型的推理,包含预填充(Prefill)和解码(Decode)两个关键阶段,前者对算力要求极高,后者则对内存访问性能更敏感。此次上海AI实验室发布的DeepLink混推方案,首次基于多种国产异构算力,将预填充和解码进行了分离(PD分离),从而可以将不同的任务,分配给不同型号的芯片,相当于能根据“球员能力”排兵布阵。

  算力芯片其实都存在一定的“偏科”——有的算力性能强,就好似爆发力突出,适合在推理的“预填充”环节进行“冲击”;有的存储性能优秀,如同耐力好,适合担纲“解码”任务。

  王辉表示,根据具体任务需求,选出“最合适球员”的混合组队模式,可让从过去的单打独斗转向系统性集团作战。

  在DeepLink混合推理方案中,上海AI实验室构建了三大原创技术底座,让异构的国产芯片可在同一个算力集群中丝滑配合、充分发挥所长。其中,DLSolver(策略求解器)就像是高明的“球队经理”,可以对不同芯片的能力进行精准评测,为其找到最适合的“场上位置”;DLRouter(智能流量路由)就像球队教练,能实时调度,确保整个算力集群顺畅运转;DLSlime(异构通信库)发挥了中场衔接作用,能够让不同芯片之间进行高效流量传输。

  实测数据显示,在千卡规模的推理算力集群中,DeepLink方案较之传统的单一芯片方案,首字响应时间(TTFT)最大可优化34.5%。这意味着当用户向AI提问时,它“蹦”出第一个字的速度快了约1/3。同时,其推理吞吐能力提升32%,相当于AI持续输出答案的过程也提速近1/3。这表明,借助DeepLink,国产算力集群实现了芯片级的“知人善任”,线”。

  DeepLink混推方案的发布,不仅是一次技术意义上的“登顶”,更有可能对我国AI产业生态带来积极影响。

  当前,国内一方面渴求算力,但由于国产算力难以整合,一定程度上还出现了资源闲置的局面。DeepLink的出现,有助于充分挖掘国产芯片的潜力,将其转化为高价值的算力资源池,从而盘活全国的算力供给。

  据透露,DeepLink混合推理方案已基本完成对8款国产芯片的适配,包括昇腾、沐曦、平头哥、壁仞等主流品牌,其推理性能平均提升幅度超过20%。这相当于用户所承担的算力成本相应地下降了20%以上。

  由于能有效激活存量算力,国内一些省级算力中心已决定采用这一技术方案。同时,上海AI实验室还在继续推动DeepLink混合推理方案与更多国产芯片开展适配,从而将为更多本土芯片企业提供宝贵的发展空间。

  值得一提的是,去年上海AI实验室曾推出DeepLink混合训练方案,成功实现了跨越千公里的多智算中心长稳混合训练千亿参数大模型。此次在“混合推理”上再次突破,意味着他们完成了“训推一体化”的全方位国产算力赋能体系建设。这将对于有效降低我国对特定算力硬件的路径依赖、保障国家算力安全、推动“人工智能+”落地,起到重要的基石作用。中国芯“混编”战力全开!上海AI实验室新技术破算力瓶颈,沐曦壁仞等均适配

“中国芯“混编”战力全开!上海AI实验室新技术破算力瓶颈,沐曦壁仞等均适配” 的相关文章

农产品 粕类:中加经贸关系有缓和预期 利空菜系

  油脂:今日主流市场现货24度棕榈油贸易商基差报价:天津(国标)05+120元/吨,涨10元/吨;山东05+100元/吨,稳定;江苏05+0元/吨,稳定;广东05-20元/吨,稳定。。据...

TCL中环:截至12月31日最新股东户数25.50万户,较上期增加0.39%

  最新披露数据显示,截至12月31日公司股东户数为25.50万户,较上期(2025年11月30日)TCL中环:截至12月31日最新股东户数25.50万户,较上期增加0.39%...

博实股份:截至1月20日最新股东户数4.64万户,较上期增加2.15%

  不对因该资料全部或部分内容而引致的盈亏承担任何责任。用户个人对服务的使用承担风险财经热点,东方财富对此不作任何类型的担保。博实股份:截至1月20日最新股东户数4.64万户,较上期增加2...

科力股份:融资净买入143.25万元,融资余额3574.49万元

  交易所最新数据显示,科力股份于2026年1月21日获融资买入1016.21万元财经热点,融资偿还872.96万元,科力股份:融资净买入143.25万元,融资余额3574.49万元...

秉扬科技:融资净买入87.32万元,融资余额1650.25万元

  不对因该资料全部或部分内容而引致的盈亏承担任何责任。用户个人对服务的使用承担风险,东方财富对此不作任何类型的担保。秉扬科技:融资净买入87.32万元,融资余额1650.25万元...

林泰新材:融资净买入255.63万元,融资余额4045.31万元

  不对因该资料全部或部分内容而引致的盈亏承担任何责任。用户个人对服务的使用承担风险,东方财富对此不作任何类型的担保。林泰新材:融资净买入255.63万元,融资余额4045.31万元...