谷歌推最强图像模型 登顶双榜单
谷歌推最强图像模型 登顶双榜单!谷歌在图像生成和编辑领域推出了最新的模型Gemini 2.5 Flash Image,该模型迅速登顶多个主流图像排行榜,成为新的性能冠军。实测结果显示,模型在角色一致性、提示词跟随、物理逻辑的真实性和画面审美方面表现出色。然而,对于中国用户来说,该模型不支持中文输入,即使使用英文提示,涉及中文内容时效果也会显著下降。此外,模型偶尔会出现多肢体等结构错误。
尽管存在一些限制,Gemini 2.5 Flash Image仍被认为是当前市场上最强的图像编辑和生成模型之一。谷歌官方演示显示,该模型已具备替代部分人工修图的能力,可帮助设计师一键完成图像修改与创意生成,适用于电商产品图的制作。单张图像生成成本不到3毛钱,极具性价比,有望大幅推进AI图像生成的商业化进程。
在正式发布之前,市场已经有一些风声。上周一款名为“nano-banana”的模型出现在大模型竞技场中,接受用户的匿名体验和打分,投票数超过250万。如今谜底揭晓,“nano-banana”正是Gemini 2.5 Flash Image。在LMArena的文生图与图像编辑两个场景中,谷歌的图像模型均拿下全球第一,在图像编辑榜单上表现尤为出色,获得1362的高分,领先第二名flux-1-knotext-max 171分。
知名AI基准测试机构Artificial Analysis也获得了早期访问权限,并在过去一周以“rex”的化名进行了测试。目前谷歌的模型在图像编辑方面排名第一,超过了OpenAI的GPT-4o和国内阿里的Qwen-Image-Edit,在文生图方面则略逊于字节Seedream 3.0和GPT-4o,排名第三。谷歌推最强图像模型 登顶双榜单