豆包大模型2.0将发布 多模态能力大幅提升
字节跳动火山引擎计划于2026年2月14日发布豆包大模型的一系列重要升级。此次发布将涵盖豆包大模型2.0、音视频创作模型Seedance 2.0以及图像创作模型Seedream 5.0 Preview。
豆包大模型2.0的基础模型能力和企业级Agent能力将有显著提升。针对音视频创作的Seedance 2.0版本,在复杂交互和运动场景下表现优异,达到了业界领先水平。该模型支持全模态输入,包括声音、视觉和图像,并且具有很强的可控性和指令遵循能力。此外热点话题,它还特别适用于影视制作、广告及营销领域,输出质量符合工业交付标准。
对于图像创作方面,Seedream 5.0 Preview版首次引入了实时检索增强功能,能够快速获取最新信息以满足时效性高的创作需求。此版本增强了世界知识与多语言处理能力,内置了科技与人文领域的丰富知识库。在理解用户意图方面也有所改进,即使面对简短或模糊的文本和图像输入也能准确捕捉用户想法,同时提高了主体一致性和图文匹配度。豆包大模型2.0将发布 多模态能力大幅提升