华为昇腾910C完成训练 突破万亿参数大模型难关

3周前 (06-08)热点话题2

  近日,深圳河套学院AI训练平台项目团队联合哈尔滨工业大学(深圳)、深圳市大数据研究院及华为相关团队,协同深智城AI算力平台,基于昇腾910C国产AI算力集群,完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。这一实践为全球第三方机构在国产算力平台上完成该级别模型训练积累了重要经验,证明了国产AI芯片能够支撑世界级超大参数模型训练工作。

  

  万亿参数大模型是人工智能领域的主流前沿模型,在逻辑推理、数理计算、代码编写和长文本理解等方面表现突出。这类模型的全参数训练对硬件算力、集群稳定性和算法适配优化有极高的要求。长期以来,全球范围内万亿级大模型训练多采用海外高端算力产品,国内国产算力主要用于模型推理和小幅微调,难以完成全参数深度训练,这是行业发展中普遍面临的技术难题。

  

  如果把训练一个万亿级参数的AI大模型比作解一道超级复杂的数学题,每一张计算卡就像一名解题员。他们不仅要分工明确、日夜不停地连轴转,还不能有人偷懒、出错或掉队。这次训练的DeepSeek-V4-Pro采用的是混合专家模型(MoE)架构,可以想象成一个庞大的“专家团”。平时回答问题只激活少数几位专家,看似高效,但后训练时,“专家们”之间的沟通量却是普通模型的几十倍。再加上动态切换的注意力机制,这对芯片算力的调度和显存资源的管理提出了极其苛刻的要求。简单来说,以前的国产算力更多是让大模型“能用”,即推理部署,而这次的“全参数后训练”则是要让模型学会自我反思和调整,计算量和通信量瞬间翻了好几倍。华为昇腾910C完成训练 突破万亿参数大模型难关

“华为昇腾910C完成训练 突破万亿参数大模型难关” 的相关文章

女子洗完澡9小时忘关热水器水阀,水从6楼流下来 小区变溜冰场 一场意外引发的社区

  女子洗完澡9小时忘关热水器水阀,水从6楼流下来 小区变溜冰场 一场意外引发的社区安全思考!在甘肃兰州,王女士洗澡后忘记关闭家中的老式太阳能热水器阀门,导致水流了整整九个小时。当时气温低...

安徽多地通知继续停课 应对强降雪天气

  安徽省气象台最新预报显示,未来三天该省将有一次大范围强降雪天气。18日江北地区将出现雨雪,沿淮淮河以北夜间转为雨夹雪或雪;19日至20日,淮北地区和江淮之间中北部将迎来大雪,阜阳、六安...

恶犬迂回反扑众人护女孩周全 外卖小哥与路人合力救人

  恶犬迂回反扑众人护女孩周全 外卖小哥与路人合力救人!2026年1月16日晚,广东汕头潮阳区和平镇和平社区发生了一起犬只伤人事件。两名女子在英西港寨前路骑行电动车时,突然被一只未拴绳的犬...

学科带头人称老师要把AI当成对手 暂不担心被取代!

  作业全会,考试全废?学科带头人称老师要把AI当成对手。孩子该不该用AI?@滤镜粉碎机采访150位学生、教师热点话题、家长。遇到了作业用AI、考试交白卷的孩子,遇到了宁可陪上补习班也不让...

红舞鞋晒捐款记录 红舞鞋称善款已用于关爱小动物行动中

  1月21日,@红舞鞋官微晒捐款记录,称:“自2025年10月底起,《红舞鞋》剧组就开始在各方共同认可的方案下,持续为校园内的小动物们献爱心。衷心感谢各位朋友一直以来对《红舞鞋》的关心、...

女子挡路收拾东西对后车竖中指被撞 网络热议事故真相

  女子挡路收拾东西对后车竖中指被撞 网络热议事故真相!近日,云南昆明斗南花市附近发生的一起车辆碰撞事故在网络上引发热议。行车记录仪拍下的视频显示,1月6日下午4时17分许,一辆黑色商务车...