国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

2个月前 (02-13)热点话题3

  继国产大模型Seedance刷屏后,本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线,其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。该模型在OpenRouter登顶热度榜首,在代理式编程单项实测中超越Claude Opus位列全球第一;而在官方确认身份前,Pony Alpha已直接驱动相关公司股价连续两日大幅上涨,成为港股AI板块最强催化。

  

  2月12日,Artificial Analysis Intelligence Index v4.0发布。在纳入397个模型、10项专业评测的权威榜单中,GLM-5以50分综合成绩并列全球第三,仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5,成为全球排名最靠前的国产模型之一。

  

  2026年2月11日,智谱AI正式发布新一代旗舰大模型GLM-5,此前以匿名代号“Pony Alpha”在海外OpenRouter平台引爆技术圈,海外热议“最强开源代码模型”“推理深度与工程化能力逼近闭源顶级水准”。当前硅谷大模型风向已全面转向Agentic Coding,GPT-5.3-Codex、Claude Opus 4.6均聚焦长时程、高复杂度工程任务,如编译内核、重构代码库、批量解决GitHub issue。GLM-5是国内首个跟上这一前沿趋势的模型,实现从“对话式代码生成”到“端到端系统工程”的突破热点话题

  

  实测显示,GLM-5具备顶尖工程能力:构建高并发电商库存系统时,不仅输出精美UI,更自主设计Redis缓存、消息队列、数据库锁,代码可直接上线运行;处理复杂开源项目报错日志时,可规划排查路径、分析依赖树并输出修复补丁,且完全开源。在专业评测上,GLM-5拿下SWE-bench Verified 77.8分(逼近Opus 4.6的80.9分)、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠,Coding与Agent能力达到开源SOTA。GLM-5采用MoE稀疏架构,擅长长程Agent任务与复杂系统设计,可支撑数百次工具调用、长程记忆与复杂指令执行。国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

“国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力” 的相关文章

5名外卖骑手砸折手指骗保获刑 精心策划的骗保团伙落网

  在河北多地,一些外卖骑手通过精心策划的“苦肉计”反复申请数额可观的保险理赔金。近日,成都高新技术产业开发区检察院对张某、邢某、崔某、仉某、魏某提起公诉,法院以保险诈骗罪分别判处他们有期...

深度解析马斯克访谈 AI与未来社会的震撼预测

  深度解析马斯克访谈 AI与未来社会的震撼预测!昨天,马斯克接受了一场长达3小时的深度访谈,分享了许多颠覆性的观点。他提到AI的进步速度超乎想象,预计2026年将实现AGI(通用人工智能...

有人卖呆呆家的土一两888元 网络热潮后的奇葩商机

  有人卖呆呆家的土一两888元 网络热潮后的奇葩商机!因一条“不会杀猪求助”视频走红,重庆合川的呆呆被网友戏称为2026年“闯祸”第一人。一场千人自发帮忙的“刨猪宴”热潮席卷全网。热潮退...

陈行甲回应俞敏洪150万年薪邀请 公益价值的市场认可

  陈行甲回应俞敏洪150万年薪邀请 公益价值的市场认可!2026年初,新东方以150万元年薪聘请了曾因公益薪酬争议备受关注的陈行甲担任集团总顾问。几天前,他刚宣布不再从自己创办的公益基金...

走进“最冷小镇”体验冰雪乐趣 不冻河奇观引关注

  岁末大寒至,静候春归来。大寒是二十四节气中的最后一个节气,过了大寒也就渐渐有了年的味道。1月20日,有着“最冷小镇”之称的大兴安岭地区呼中区最低气温达到-36℃,呼气成霜、泼水成冰是日...

老外“扎堆”来华就医这事怎么看 医疗优势吸引国际患者

  最近,社交媒体上走红的视频显示,一名外国博主因本国就医效率低而选择来中国看病。这类视频引发了公众对外国人“扎堆”来华就医现象的关注。人们好奇,体验“医在中国”的外国人是否越来越多?他们...