DeepSeek提到的FP8到底是啥 引发AI圈热议

2小时前热点话题2

  DeepSeek提到的FP8到底是啥 引发AI圈热议!DeepSeek V3.1发布后,一则官方留言在AI圈引起轰动。短短不到20个字的留言中提到新的架构和下一代国产芯片,信息量巨大。受此影响,国产芯片企业的股价纷纷上涨,例如寒武纪早盘盘中大涨近14%,总市值跃居科创板头名。半导体ETF也在半天内大涨5.89%。

  

  许多人对UE8M0 FP8这一概念感到困惑。UE8M0 FP8可以拆分为两部分解释。UE8M0是MXFP8路径中的“缩放因子”,而MXFP8是Open Compute Project在2023年发布的8 bit微缩块格式。Open Compute Project是一个由Facebook(现Meta)、英特尔、Rackspace等发起的开源硬件协作计划,旨在通过共享数据中心及服务器设计推动行业效率提升。其成员包括微软、谷歌、亚马逊、AMD、英伟达以及国内的阿里、腾讯、百度等公司。

  

  MXFP8基于FP8建立,将常规浮点格式压缩到8 bit。MXFP8的核心思想是将张量切成固定长度的“块”,为每个块指定一个2的整数次幂作为“缩放因子”,然后将块内所有数值除以这个系数后再写成FP8。这种块级的缩放方式保留了8 bit位宽,同时扩展了可用动态范围。UE8M0中的U表示无符号,E和M分别代表指数位和尾数位分配到的bit数。UE8M0指8个bit全部分配给了指数位。

  采用全指数表示缩放因子的方式有多个好处。首先,处理器在根据缩放因子复原数据时只需移动指数位,无需进行浮点乘法、规格化或舍入逻辑,缩短了时钟关键路径。此外,UE8M0的动态范围覆盖2^(−127)到2^128,为后续块缩放提供了充足空间。它还能解决单尺度FP8无法同时处理大/小值的问题,减少了信息损失。

  

  UE8M0 FP8更适配“下一代国产芯片”。目前,大部分已量产的国产AI加速器仍使用FP16/BF16 + INT8计算通路,未集成完整的FP8乘加单元。但摩尔线 NPU等新款国产芯片已在宣传资料中列出“原生 FP8”或“Block FP8”支持,并与多家厂商联合验证UE8M0格式。虽然下一代国产芯片在HBM/LPPDDR带宽方面仍有差距,但UE8M0让一组32个FP8数据只追加8bit缩放引子,相比传统FP32节省75%流量,成为重要优化方向。DeepSeek提到的FP8到底是啥 引发AI圈热议

“DeepSeek提到的FP8到底是啥 引发AI圈热议” 的相关文章

章子怡舞台上意外摔倒已就医 摔伤引发网友热议

章子怡舞台上意外摔倒已就医 摔伤引发网友热议

  4月29日,有网友发布了一段视频,称在高铁站偶遇章子怡,她坐在轮椅上被工作人员推着。这段视频迅速引发网友热议,大家纷纷猜测章子怡在哪里摔倒了,以及她的身体状况如何。...

《焦点访谈》 20250430 逐梦苍穹不止步

  本期节目主要内容: 2025年4月30日,神舟十九号飞船在东风着陆场顺利返回,三名在太空值班半年的航天员蔡旭哲、宋令东和王浩泽平安归来。因为受到着陆场气象条件限制,三名航天员的返回比此...

双腿长度相差较大 女孩的教师梦破灭 残疾女孩的无奈

  双腿长度差十几厘米 28岁残疾女孩的教师梦破灭了 (新浪新闻在线) 【 齐鲁晚报·齐鲁壹点旗下短视频产品 】...

南宁动物园“丢那猩”上狠活 网红猩猩扔石砸伤游客

  5月1日,广西南宁动物园发生一起意外事件。一只名为“丢那猩”的黑猩猩向游客投掷石块,导致一名游客受伤。其他游客见状纷纷躲避,受伤游客随后被急救车送往医院治疗。   南...

日网红炒作“中国人偷电”反成笑柄 文化差异下的偏见闹剧

日网红炒作“中国人偷电”反成笑柄 文化差异下的偏见闹剧

  日本一网红指责中国游客在多功能厕所里的公共插座充电,称其为“偷电”,并在社交平台上发布了一张照片。照片中一名游客蹲在厕所里给手机充电,该网红配文批评,并要求不守规矩的人滚回国。...

《探索·发现》 20250430 世纪考古大发现(19)

  本期节目主要内容:军事原料和冷热兵器,见证明末江口水战。巴蜀青铜器惊现江口,发掘现场迷雾重重。透过印章,穿越历史,考古人员与古人完成对线))...