OpenAI发布最强专业模型GPT-5.4 原生电脑操控功能突破边界

2个月前 (03-06)热点话题3

  OpenAI发布最强专业模型GPT-5.4 原生电脑操控功能突破边界!OpenAI发布了全新的旗舰基础模型GPT-5.4,该模型在ChatGPT、API以及开发工具Codex中同步上线。OpenAI称GPT-5.4是“迄今能力最强、最高效的专业工作前沿模型”,重点面向企业办公与复杂知识工作场景。相比此前版本,GPT-5.4的最大变化在于强化了AI智能体的能力。在API和Codex中,GPT-5.4首次实现了原生级“电脑操作”功能,支持智能体跨软件执行复杂工作流。

  

  GPT-5.4不仅能生成文本或代码,还首次将原生电脑操控能力引入通用模型,能直接操作电脑软件、浏览网页、控制鼠标和键盘完成任务,并可与电子表格、金融分析工具等企业应用深度整合,深度嵌入微软Excel和谷歌表格。在ChatGPT中,GPT-5.4支持“提前展示思维过程”,允许用户在模型响应过程中调整任务方向,并提升了深度网页搜索与长逻辑语境下的上下文保持能力。

  

  业内认为,GPT-5.4的一系列升级标志着AI模型正从“对话工具”走向自动化执行任务的数字代理系统,进一步渗透企业生产力软件与专业知识工作。OpenAI本周四同时推出两个版本,包括更擅长复杂推理的GPT-5.4 Thinking以及高性能的GPT-5.4 Pro,分别面向付费用户和高端企业用户。

  

  在计算机操控基准测试OSWorld-Verified中,GPT-5.4以75.0%的成功率超越人类平均水平72.4%,较前代GPT-5.2的47.3%大幅跃升。同期发布的财务服务套件显示,GPT-5.4在OpenAI内部投行基准测试中的得分从GPT-5的43.7%跃升至88.0%。早期测试机构给出积极反馈。投资公司Walleye Capital的AI解决方案主管Daniel Swiecki表示,GPT-5.4在内部财务和Excel评估中准确率提升了30个百分点。AI人才平台Mercor的CEO Brendan Foody称其为该公司“迄今尝试过的最佳模型”,并表示GPT-5.4已在Mercor面向专业服务工作的APEX-Agents基准测试中排名第一。OpenAI发布最强专业模型GPT-5.4 原生电脑操控功能突破边界

“OpenAI发布最强专业模型GPT-5.4 原生电脑操控功能突破边界” 的相关文章

中医体质有国家标准了 规范体质辨识方法

  市场监管总局近日批准发布了《中医体质分类与判定》(GB/T 46939—2025)推荐性国家标准。该标准由国家中医药管理局组织起草,将于4月1日正式实施。   《中医...

女子生吞鱼胆中毒全身发黄 误信偏方险丧命

  近日,南京的王阿姨在家杀鱼时想到,既然良药苦口,那么鱼胆这么苦,是否也有治病的好处。于是她生吞了鱼胆。两小时后,王阿姨开始感到恶心呕吐、腹痛和腹泻。起初,家人以为这只是普通的肠胃不适,...

长沙两站一场出现不同程度晚点或取消 冰雪天气影响出行

  1月20日,长沙城区开始落下冰粒,给人们的出行带来困扰。受天气影响,长沙黄花国际机场出现航班延误情况,截至当日10时,已取消74个航班。   ...

此次寒潮幕后推手西伯利亚强冷气团 低温雨雪冰冻灾害席卷多地

  寒潮自北向南逐步影响我国大部分地区,中东部遭遇入冬以来最强雨雪冰冻天气。内蒙古阿尔山地区的最低气温达到零下44.5℃,河南、安徽、湖南、贵州等地出现暴雪和冻雨,导致道路结冰、航班调整及...

李亚鹏称从未收到过这么多礼物 直播打赏全数捐赠

  李亚鹏称从未收到过这么多礼物 直播打赏全数捐赠。1月20日晚,李亚鹏在社交媒体上发布了一段视频,并配文感谢大家对嫣然的关注,表示还有很长的路要走,希望大家以平静的心态对待。视频中,他提...

嫣然基金已筹款超2300万 回应:项目预算已筹满 捐款通道将暂停

  嫣然基金已筹款超2300万 回应:项目预算已筹满 捐款通道将暂停!1月20日,嫣然天使基金表示近期收到了大量捐款。基金会承诺将珍惜并妥善使用这些善款,继续用于唇腭裂患者的医疗救助项目。...