DeepSeek-V3.2-Exp模型正式发布 稀疏Attention架构提升效
2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。该模型采用了稀疏Attention架构热点话题,能有效降低计算资源消耗,提升推理效率。目前,华为云大模型即服务平台MaaS已上线这一新模型。华为云继续使用大EP并行方案进行部署,通过稀疏Attention结构叠加实现长序列亲和的上下文并行策略,同时优化了模型的时延和吞吐性能。DeepSeek-V3.2-Exp模型正式发布 稀疏Attention架构提升效率