主动“认输”的DeepSeek,这次到底行不行? 从震撼到预期的转变
2025年初,DeepSeek发布了R1,引起了巨大震动。英伟达单日蒸发6000亿美元,黄仁勋的财富迅速缩水。全球科技媒体集体失语三天后,用同一个词描述他们看到的东西:震撼。
一年多后,DeepSeek再次发布新旗舰V4。这一次,市场反应精准而克制。中芯国际涨了12%,华虹涨了19%,智谱跌了10%。这表明DeepSeek已经不再是一个“意外”,而是成为一种“预期”。
过去三个月,AI行业的发布节奏失控。Claude、GPT、元宝、千问等大模型纷纷更新,连一向低调的Gemini也开始在发布会上鼓掌热场。每家公司都在宣称自己最强,对手落后三到六个月。有趣的是,DeepSeek也说V4落后闭源模型三到六个月。
外界的第一反应是觉得这家公司被卷到了不得不发布新产品。但这个判断可能是错的。DeepSeek在发布声明里写“欢迎来到百万token上下文的时代”,语气更像是宣布自己打开了一扇门,而不是匆忙翻过一堵墙。更重要的是,DeepSeek给出的核心信号是成本路线系列芯片驱动的算力集群上线的价格将大幅下降。这表明DeepSeek已经想好了下半场棋局。
理解V4,必须先理解DeepSeek的基本哲学:不争第一,争最划算。V4 Pro的参数规模达到1.6万亿,但每次推理实际激活的只有490亿。这种混合专家架构(MoE)的本质是按需调用,大幅压缩推理成本,性能却不打折扣。同时,V4还将上下文窗口扩展到了100万token,可以一次处理大量数据,减少了分段喂给AI的工作量。
然而,这些技术优势正在变得越来越难以构成护城河。百万token上下文和MoE架构已经被多家实验室采用。代码基准测试第一的位置频繁更迭。Union Bancaire Privee的分析师指出,当所有模型都足够好时,“最好”这个词就失去了意义。接下来的竞争在于价格、生态、信任以及谁能将AI融入人们每天必须使用的东西中。主动“认输”的DeepSeek,这次到底行不行? 从震撼到预期的转变