AI,开始偷懒了?

5天前社会热点2

  “以前上传PDF让它翻译,页面会变成左右两栏,右边原文,左边逐句翻译,但现在没有了。即使明确要求逐句翻译,出来的也只是梗概。”文字工作者关佳怡(化名)近日发现,她此前常用的某AI智能对话问答助手使用体验正明显下降。

  近期,社交平台上像关佳怡一样吐槽AI“越来越难用”“频频出错”的用户不在少数。AI,真的不好用了吗?

  余京生(化名)主要使用AI辅助软件开发。他表示,2025年他使用ChatGPT时,只要提出需求,模型就会尝试不同解决路径,给出的代码基本方向无误,他只需要小修小补。

  但现在,即便他把要求描述得非常细致,“ChatGPT也像一个机械执行者”,还会频繁出现语法错误。并且模型不会自我检查,反而偏执地认定失败是硬件环境所致。

  “总之退化了很多,我用Grok和DeepSeek等工具也感觉明显。目前ChatGPT代码能力仍然最强,但用着很吃力。”余京生说。

  付费使用DeepSeek、Kimi的宁泽(化名)在社交媒体发帖称,DeepSeek最近晚上“降智”得厉害。他解释称,白天让模型写代码经常一遍过,但到了深夜,类似难度的代码需要反复修改几次才能通过。此外,模型还容易遗忘他前两轮提出的要求。

  早在2026年1月,便有用户开始反馈AI的“不对劲”,主要表现为套话变多、回答表面和分析变少。社交平台上“感觉AI变‘懒’了”的话题下,用户称,DeepSeek和豆包一年前的回答会给到很多意想不到的启示,但现在倾向于用一些套话匆匆收尾。众多网友附议:“AI很套路”“回答没有增量内容”“换汤不换药”。

  据悉,DeepSeek新推出的“专家模式”现在已无法上传文件,官方此前提示“擅长复杂问题,资源紧张,不支持文件上传”。在使用快速模式时,中新经纬发现,目前要求DeepSeek翻译长文本PDF,它也会直接提示超出能力范围。此外,近段时间以来,DeepSeek多次因为“崩了”登上微博热搜。

  5月27日,中新经纬在DeepSeek对话框输入“有用户反映你越来越难用了,是因为降智了还是偷懒”。模型思考9秒后回复称,这是现实的无奈和成长的烦恼,并将问题归咎于“算力成本”“安全困境”“迭代阵痛”三方面原因。

  相比DeepSeek的认真解释,豆包面对质疑则选择重新干活证明自己。关佳怡提到,她让豆包翻译文档,AI偷懒被质疑后,又重新恢复按照原来的格式规范完成了任务。“这玩意儿也会偷懒,学什么不好!”她吐槽。

  对于用户使用AI体验变差的情况,Kimi则将其归于模型版本更新、上下文复杂度、提示词影响三方面原因。

  5月29日,中新经纬致电豆包官方客服询问AI执行任务时准确度下降的原因,客服解释这是模型升级所致。因为模型在不断提升,过程中会出现一些小差错。

  艾媒咨询发布的《中国AI大模型市场发展状况及用户行为调查数据》显示,在2026年中国消费者认为目前AI大模型存在的缺陷中,“无法实时优化(给出错误反馈后无法通过自我修正实现自我成长)”以45.81%的占比位居首位。“推理能力较弱(需要逻辑、数值推理等复杂问题时表现不佳)”以43.21%的占比位列第二,“灾难性遗忘(问题求解阶段,无法记住处理过的数据或场景)”以42.62%紧随其后。

  赛迪顾问人工智能与大数据研究中心分析师韩子哲表示,除Transformer架构固有的长文本性能衰减、AI生成内容回流带来的训练数据污染等技术局限外,商业考量是当前多款大模型“降智”的主要原因。

  值得注意的是,大模型市场的价格战正愈演愈烈。5月22日,DeepSeek宣布旗舰模型V4-Pro的API价格永久下降75%。5月27日,小米紧随其后宣布MiMo-V2.5系列API永久降价,最高降幅达99%。

  韩子哲解释,面对日益上行的Token成本压力,部分厂商引入了动态推理预算、缓存优化及路由降级等技术手段,优先保障系统的整体吞吐量与响应速度,以在时延与成本之间寻求平衡。这种通过缩减单次推理深度来控制运营成本的隐性调整,实际上是以牺牲模型在复杂任务上的表现,换取规模化服务的可持续性,最终直观体现为用户体验的明显下降。

  不过,也有业内人士提出不同看法。一家模型企业的相关负责人表示,模型本身的能力从发布时就已设定,不会因使用一段时间而自动降级。对于用户体感变差的现象,他归结为四方面原因。

  一是长程任务正成为主流,此前习惯分步走的用户,受上下文环境影响,容易体验不佳;二是模型上下文越来越长,超长任务要求调用小模型辅助,不同版本间的协作容易出现偏差;三是模型与开发平台(即“脚手架”)的磨合不够好,后者当前更新太快;四是用户在不同平台之间切换使用模型,经过中转环节,体验自然不如原生平台流畅。

  极佳视界联合创始人、首席科学家朱政也指出,当前模型企业的算力已难以支撑海量用户的复杂任务需求。“以前大家主要用大模型进行简单聊天,消耗算力较少。但现在,AI被当作一个可以干活的工具,消耗的Token是海量的。”

  朱政表示,用户规模的暴涨,导致算力资源空前紧张。他透露,其公司租用算力卡的等待时间,已从去年的一两天延长到如今排一两周都不一定有资源。

  在朱政看来,像豆包这类模型开始分层收费,其实是好事。对经济条件允许的用户而言,这能保障其专业化需求、提高效率;对企业来讲,也能合理分流,保证免费用户的基础聊天不受影响,同时让商业模式更加清晰。AI,开始偷懒了?

“AI,开始偷懒了?” 的相关文章

生椰枣汁为何成“危险饮品”?印度尼帕患者疑误饮蝙蝠污染饮料

  近日,印度东部的西孟加拉邦近期出现尼帕病毒感染病例,目前已有5例确诊病例,近100人被要求居家隔离。受此影响,泰国和尼泊尔已相继加强针对来自印度旅客的卫生筛查措施。...

研究发现午睡正悄悄拉开“大脑年龄差”,但这两类人真的不适合午睡

  你有每天午睡的习惯吗?每天午睡和很少午睡的人,长期来看差别在哪里?别小看这个习惯,它正在悄悄拉开人与人之间的“大脑年龄差”。   午睡,最受益的器官可能就是我们每天高...

28岁无臂博士生,用脚敲出4篇SCI论文!

28岁无臂博士生,用脚敲出4篇SCI论文!

  近日,太原理工大学2023级数学学院博士生王海港以第一作者身份撰写的研究论文被《自然》旗下系列期刊《通讯—物理》录用。很难想象,这篇论文是无臂青年王海港用时两年半,凭借双脚“书写”而成...

“毛孩子”坐上高铁回家过年啦!保姆级托运攻略带它一起回家

“毛孩子”坐上高铁回家过年啦!保姆级托运攻略带它一起回家

  “12306开放宠物春节托运预约了!”1月28日,有网友在社交平台发文,晒出自己通过高铁托运宠物狗狗的订单截图。帖文发布后引发大量关注,网友纷纷留言询问宠物托运的方式以及价格。...

茶颜悦色新品味道被吐槽像猴子腋下 回应:已作出调整

  近日,有网友在网络平台吐槽称,茶颜悦色新品奶茶的味道“像是和猴子打架争夺一根熟透了的黑色香蕉社会热点,结果一不小心把香蕉糊在了猴子腋下,热腾腾的酸臭猴子腋下弥漫着熟透的香蕉味”。该网友...

海南公告:奖励陈奕迅100万元,张学友50万元!

海南公告:奖励陈奕迅100万元,张学友50万元!

  2月2日,海南省旅游和文化广电体育厅发布公告,公示陈奕迅、张学友大型演唱会奖补情况。具体内容如下:   据公告,根据海南相关文...