小米凌晨模型三连发:罗福莉称为智能体时代打造,曾被误认为DeepSeek V4
3月19日凌晨,小米发布面向agent时代的旗舰基座模型Xiaomi MiMo-V2-Pro,以及全模态基座模型Xiaomi MiMo-V2-Omni和语音合成模型Xiaomi MiMo-V2-TTS。雷军在智能排行榜 Artificial Analysis 上,位列全球第八。按大模型品牌来排名,排在全球第五,超过了xAI Grok。模型刚刚完成,未来一段时间,还会快速迭代增强。
雷军表示,在AI领域上相对比较低调,实际进展可能比大家看到的要快很多,“在AI领域,我们今年的研发和资本投入就将超过160亿元。我相信,只要我们坚持持续投入,小米在AI时代一定会交出一份靓丽的答卷。”
此前两个没有署名的匿名模型曾悄然上架知名API聚合平台OpenRouter,代号分别是Hunter Alpha和Healer Alpha,它们没有任何宣传,调用量却开始以一种不寻常的速度持续攀升。
其中,调用量最多的Hunter Alpha多天登顶日榜,累计调用量突破 1T tokens,由于其惊艳的处理表现,加之当时恰逢DeepSeek V4即将发布消息流传,外界纷纷猜测,这很可能是DeepSeek V4内测版本。
OpenClaw创始人Peter Steinberger甚至专门在社交平台X上发文,打听这两个匿名模型的身份信息——最终谜底揭晓,这个大模型来自于小米。
小米大模型团队负责人罗福莉在社交媒体发文,这是为Agent时代真正打造的首个全栈模型家族,“我称这是悄无声息的伏击——不是因为我们有计划,而是因为从Chat到Agent范式的转变发生得如此之快,甚至我们自己都几乎不敢相信。中间某个地方,有一个过程既令人兴奋、痛苦,又迷人。”
罗福莉还在文中直言,为了说服团队体验“复杂的代理式架构”,要求“明天MiMo团队中对线次的任何人可以辞职”。
此前曾引发舆论热议的前阿里千问技术负责人林俊旸则回复:“very impressive!”。
据小米技术团队披露:通过 Scaling 参数和算力,MiMo-V2-Pro 拥有了更大、更强的模型基座。
据小米介绍,MiMo-V2-Pro 专为Agent(智能体)场景深度优化。OpenClaw 是近期开源社区备受瞩目的通用智能体框架。作为驱动此类框架的核心,底层模型的能力上限直接决定了系统的业务表现。MiMo-V2-Pro 针对复杂多样的 Agent Scaffold 进行 SFT & RL,具备更强的工具调用与多步推理能力。在 OpenClaw 标准评测榜单 PinchBench、ClawEval 上,MiMo-V2-Pro 效果处于全球顶尖。
从API价格来看,MiMo-V2-Pro 模型根据使用量分段计价:256K上下文以内:输入1美元/百万 tokens,输出3美元/百万 tokens;1M上下文以内:输入2美元/百万 tokens,输出6美元/百万 tokens。
值得注意的是,在官方模型体验页面,同步上线了MiMo Claw,免费解锁MiMo-V2-Pro养虾体验。此外,MiMo Claw模块现已全面打通金山WebOffice生态,原生支持Word、Excel、PPT、PDF四大主流格式,覆盖超95%的日常文档类型;小米浏览器目前也已经接入MiMo-V2-Pro,助力AI搜索。小米凌晨模型三连发:罗福莉称为智能体时代打造,曾被误认为DeepSeek V4