豆包大模型重要升级 多模态能力全面提升
字节跳动火山引擎计划于2026年2月14日发布豆包大模型的一系列重要升级。此次发布包括豆包大模型2.0、音视频创作模型Seedance 2.0和图像创作模型Seedream 5.0 Preview。
豆包大模型2.0将正式推出,其基础模型能力和企业级Agent能力将大幅提升。对于音视频创作模型Seedance 2.0,升级后将具备高可用率的复杂交互和运动生成能力,达到业界最佳水平。该模型还支持多模态输入,并且在指令遵循方面表现出色,深度适配影视、广告及营销场景,输出质量符合工业交付标准。
此外,豆包图像创作模型Seedream 5.0 Preview首次引入了实时检索增强功能,能够获取最新知识和资讯,精准响应具有时效性的创作需求。模型内置丰富的科技与人文领域世界知识,增强了多语种能力。理解与生成表现全面提升,即使面对简短或模糊的文本和图像输入,也能更好地理解用户意图,主体一致性和图文对齐的表现也有所改进。豆包大模型重要升级 多模态能力全面提升