DeepSeek迎来大更新 新增快速与专家模式
国产大模型DeepSeek再次迎来重要更新。4月8日,在最新版本中,DeepSeek输入框上方新增了“快速模式”与“专家模式”。网页显示,快速模式适合日常对话,即时响应,支持图片和文件中的文字识别;专家模式则擅长处理复杂问题。这是DeepSeek在官网页面首次引入分层模式。
这次更新让人们对DeepSeek即将发布的V4版本充满期待。据外媒报道和社交媒体信息,DeepSeek很可能在今年4月正式上线日,DeepSeek官方网站连续三天出现不同程度的异常,涉及网页对话、App及API等,故障分别持续约1小时48分、10小时13分和1小时3分。其中,3月29日晚上22点开始,一直到30日早上7点,服务出现长达8小时的大规模访问异常,大量用户遭遇页面卡顿、反复提示“服务器繁忙”甚至功能完全中断。外界猜测这些大规模宕机可能是由于V4更新所导致,但DeepSeek内部人士未对此作出回应。
今年1月12日,DeepSeek发布了一篇新论文《基于可扩展查找的条件记忆:大语言模型稀疏性的新维度》,该论文由北京大学和DeepSeek共同完成。这篇论文提出了“条件记忆”这一概念,旨在解决当前大语言模型存在的记忆力“短板”。
2月13日,有消息称DeepSeek正在测试新的长文本模型结构,支持1M上下文。其API服务仍为V3.2,仅支持128K上下文。当时人们猜测,DeepSeek或将在春节再次发布新模型,复刻去年春节期间的现象级轰动。然而,春节AI大战虽然热闹,但DeepSeek却始终没有动静,相关期待一度落空。
券商研报显示,DeepSeek最新的V4模型将聚焦国产化。野村证券分析认为,作为去年推出DS-V3/R1并搅动全球AI产业链的玩家,DeepSeek的新技术布局不仅将推动中国AI产业链创新周期加速,还将在算法与工程层面缩小中国与全球大模型产业的差距。业内人士普遍认为,此次V4发布对于DeepSeek来说难度颇大,要复刻去年春节期间的轰动性颇有技术挑战,因为国产大模型已经卷入深水战场,竞争极度激烈。DeepSeek迎来大更新 新增快速与专家模式