全球六大顶级AI实盘厮杀 DeepSeek第一 真金白银交易比拼

9小时前热点话题5

  全球六大主流大语言模型各自获得一万美元,在同一真实市场中进行实盘交易。上周六,美国人工智能研究实验室nof1.ai在其“阿尔法竞技场”平台上举办了一场活动,给六个顶级模型一万美元的真金白银,让它们下场交易。

  这六大模型包括Anthropic的Claude 4.5 Sonnet、深度求索的DeepSeek V3.1 Chat、谷歌的Gemini 2.5 Pro、OpenAI的GPT 5、xAI的Grok 4和阿里通义的Qwen 3 Max。每个模型获得10,000美元的真实资本,在交易所Hyperliquid上,以相同提示词与输入数据条件下,交易加密货币的永续合约。比赛的目标是将风险调整后的收益最大化,每个模型需自行产生超额收益、确定仓位、择时交易并管理风险。

  系统会提供当前时间、账户信息、持仓情况以及实时价格和指标等数据,要求模型做出决策:如果持有仓位,是继续持有还是平仓;如果空仓,是买入还是继续观望。经过近60小时的激战后,截至北京时间周一17:18,DeepSeek的持仓总市值接近1.4万美元,收益率约40%,最高时一度接近1.5万美元,表现最佳。Grok 4次之,目前持仓总市值在1.33万美元附近。这两个模型主要通过做多比特币和以太坊获利。Claude主要交易瑞波币和以太坊,Qwen则专注于以太坊,两者收益位列三四,但也整体跑赢比特币现货走势。相比之下,GPT 5和Gemini出现了明显亏损,目前持仓总市值分别为7300美元和6900美元,意味着两个模型已亏损约2700和3100美元,表现最差。

  nof1.ai表示,进行这一竞赛是为了让基准测试更贴近真实世界,金融市场是最理想的试炼场热点话题,因为这类市场具有动态性、对抗性、开放性与高度不可预测性。这些特质能以静态测试无法企及的方式真正挑战人工智能。nof1.ai未提到本次竞赛的具体结束时间,只表示第一季将运行数周,随后推出重大更新的第二季。有分析认为,市场早已期待在DeFAI方向上出现杀手级应用,让LLM参与链上博弈有很大的想象空间。全球六大顶级AI实盘厮杀 DeepSeek第一 真金白银交易比拼

“全球六大顶级AI实盘厮杀 DeepSeek第一 真金白银交易比拼” 的相关文章

冯彦哲复刻日本队庆祝动作回击 胜利复仇

冯彦哲复刻日本队庆祝动作回击 胜利复仇

  5月3日,在2025苏迪曼杯半决赛中,中国混双组合冯彦哲/黄东萍以2-0战胜日本组合绿川大辉/五十岚有纱,为中国队赢得一分。赛后,冯彦哲用刀削面动作庆祝胜利,这一动作复刻了2023年日...

苏杯半决赛中国3比0日本 挺进决赛冲击14冠

苏杯半决赛中国3比0日本 挺进决赛冲击14冠

  2025年苏迪曼杯半决赛于5月3日在厦门举行,中国羽毛球队以3比0战胜日本队,晋级决赛,将冲击第十四座苏迪曼杯。中国队在苏杯历史上曾六次对阵日本队,保持全胜。上届苏杯(2023年)半决...

贵州游船倾覆 目击者:大风冰雹交加 恶劣天气突袭

贵州游船倾覆 目击者:大风冰雹交加 恶劣天气突袭

  贵州游船倾覆 目击者:大风冰雹交加 恶劣天气突袭。5月4日16时40分许,贵州毕节市黔西市新仁乡化屋村百里画廊景区发生游船倾覆事故。事故已造成3人死亡、60人送医救治,另有14人正在搜...

香港女星谢婷婷宣布怀第二胎 温馨分享孕照

香港女星谢婷婷宣布怀第二胎 温馨分享孕照

  43岁的谢婷婷自2019年诞下女儿Sara后,便移居加拿大专注育儿生活。昨天,她在社交平台上宣布怀上了第二胎,并分享了宝宝的超声波照片,笑容灿烂。她还上传了一张与伴侣在车里的合照,并写...

陕西村民被冒名贷款40余万 签名伪造引发争议

陕西村民被冒名贷款40余万 签名伪造引发争议

  陕西省咸阳市礼泉县叱干镇郭村村民李平在不知情的情况下“被”贷款了44.9万元,贷款协议上的签名经鉴定系伪造。   ...

为什么一上班就容易头痛?上班就头疼是怎么回事

为什么一上班就容易头痛?上班就头疼是怎么回事

  上班时头疼可能是由于多种原因引起的,包括工作环境问题、过度劳累、神经性头痛、颈椎病、高血压等。详情如下:      ...