开盘大涨!智谱迄今最强模型来了

2周前 (04-08)财经热点2

  当天,该公司发布了其迄今最智能的模型——GLM-5.1。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,GLM-5.1能够在一次任务中独立、持续地工作长达8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。

  与此同时,GLM再度提价10%,编码场景定价追平海外头部厂商Anthropic,国产模型价格首次对齐海外。

  2025年3月,AI安全研究机构METR提出了一个改变行业认知的指标:任务完成时间线(Task-Completion Time Horizon)——不再衡量模型“多聪明”,而是衡量它能独立完成多长时间的人类任务。

  这对模型厂商提出了更深层次的挑战。在长程任务中保持稳定输出,模型面对的不只是更大的代码量,而是一连串复杂的工程决策点:主动跑benchmark、定位瓶颈、修改方案、再跑测试。

  模型需要像一个真正的工程师一样,形成“实验→分析→优化”的完整闭环,而不是写完一版代码就停下来等人打分。

  为此,团队在训练方法上做了几个关键的调整,包括扩展任务过程的训练窗口、特别优化模型的tool use能力。迭代后,GLM-5.1能够在单次任务中持续、自主地工作长达8小时。

  这意味着,用户睡觉的8小时,可以变成模型“上班”的8小时。过程中,模型可以自主规划、执行、测试,碰壁时主动切换策略,出错后自行修复,最终交付完整的工程级成果。

  以“8小时从零构建Linux桌面”任务为例,用户白天画好架构草图,睡前交给GLM-5.1,早上醒来已产出完整系统。

  历时8小时整,执行1700多步,GLM-5.1在20分钟时产生第一个有意义的成果,8小时后产出了一套功能完善的Linux桌面系统,包括:完整的桌面、窗口管理器、状态栏、应用程序、VPN管理器、中文字体支持、游戏库等,4.8MB的配套文件。这相当于一个4人团队一周的开发工作量。

  智谱技术团队介绍,上述任务全程没有单元测试兜底、没有代码审查、没有文档。值得一提的是,它甚至给自己的代码写了一个14小时的回归测试——并且通过了测试。

  过去两年,行业用Benchmark衡量模型有多智能。下一阶段的衡量标准应该是“能工作多久”,即模型在长程任务中的持续表现,独立完成人类专家几小时甚至几天才能做完的工作。

  智谱认为,延长模型的“有效工作时长”是提升智能体能力的一个基础维度。在这条路上仍然有显著的技术挑战:如何克服模型面对复杂任务的上下文焦虑、如何在数千次工具调用后保持执行的一致性、如何更早地跳出局部最优,以及更重要的是如何在没有确定数值指标的任务上建立可靠的自我评估机制。

  “GLM-5.1是我们在这个方向上迈出的一步,我们会持续推进。”智谱表示,其究极目标是全自治智能体(Autonomous Agent),模型7×24小时不间断地感知任务、分解目标、执行交付、自我评价与纠正、自我进化,从此无需人类介入。

  让海外技术社区格外关注的是,在编程能力方面,GLM-5.1的性能首次实现了与国际头部模型的对齐。

  Claude Opus 4.6由Anthropic开发,该公司年化收入近期首次超越OpenAI,被视为商业化能力最强的海外头部厂商。最新业务数据显示,Anthropic年化收入(ARR)已达到300亿美元,这超过了OpenAI此前公布的250亿美元年化收入。

  在这一背景下,中国开源AI在最核心的工程能力指标上,首次具备与国际先进水平同场竞技的能力。以往国内开源模型常被定位为落后一方,与国际最强闭源模型的成绩始终存在一定距离。而GLM-5.1此次的榜单结果,一定程度上打破了这种固有认知。

  这一变化超出了不少人的预料——一年前,大模型行业还陷在“价格战”中,普遍降价九成以上争夺份额。如今的转变,意味着国产模型正逐步从低价策略转向以性能为本,尝试建立与国际头部厂商的对等地位。开盘大涨!智谱迄今最强模型来了

“开盘大涨!智谱迄今最强模型来了” 的相关文章

海昌新材1月20日快速反弹

  盘中快速反弹,5分钟内涨幅超过2%,截至11点18分,报30.21元财经热点,成交2.79亿元,换手率5.57%。海昌新材1月20日快速反弹...

中兴商业:2025年前三季度扣非净利润同比增长29.28%

  在互动平台回答投资者提问时表示,2025年前三季度扣非净利润同比增长29.28%,主要是两方面原因,一方面是员工持股计划费用同比减少;另一方面是公司围绕主业不断创新发展,提升主业盈利能...

珍宝岛1月21日快速回调

  盘中快速回调,5分钟内跌幅超过2%,截至10点47分,报9.07元,成交1.12亿元财经热点,换手率1.32%。珍宝岛1月21日快速回调...

特朗普:美国核心通胀率为1.5% 第四季度经济增长率预计为5.4%

  特朗普在达沃斯发表讲话,称美国核心通胀率为1.5%,第四季度经济增长率预计为5.4%财经热点,美国经济增长有望达到国际货币基金组织预测速度的两倍。特朗普:美国核心通胀率为1.5% 第四...

中超控股:接到某火箭单位40套推力室顶盖毛坯订单

  在互动平台表示,公司孙公司江苏精铸致力于航空航天、舰船燃机、医疗等方面的高温合金精密铸件,形成了自主可控的精密成型技术体系,已为航天科工火箭、上海空间推进研究所等单位提供航天火箭发动机...

兴证全球基金谢治宇:重点配置海外算力、半导体设备等领域

  谢治宇在四季报中表示,以光模块为代表的海外算力板块在海外大客户加单以及新技术发展的刺激下持续创出新高。尤其在光模块、领域,国内的供应链龙头在国际舞台上获得了更高的话语权;在液冷、电源等...