火山引擎发布视频生成模型

2024年09月25日 | 小微 | 浏览量：60162

火山引擎发布视频生成模型
图片来源于网络，如有侵权，请联系删除

新华社客户端深圳9月25日电（记者孙飞）24日，在字节跳动旗下火山引擎于深圳举行的人工智能（AI）创新巡展上，火山引擎发布了豆包视频生成模型，具有一致性多镜头生成、动态运镜、支持3D动画等功能。当日，火山引擎还发布了音乐模型、同声传译模型，升级通用语言模型、文生图模型、语音模型等。

火山引擎方面介绍，豆包视频生成模型可让视频在大动态与运镜中自由切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法，攻克了多镜头切换的一致性难题，在镜头切换时可同时保持主体、风格、氛围的一致性。

火山引擎总裁谭待说，视频生成有很多难关亟待突破，豆包模型会持续演进，在解决关键问题上探索更多可能性，加速拓展AI视频的创作空间和应用落地。

24日，字节跳动还发布了豆包全模态大模型家族。统计数据显示，豆包大模型今年5月发布以来，语言模型日均使用量不断增加，图片、语音等多模态数据处理量大幅提升。第三方机构QuestMobile数据显示，截至7月，豆包月活用户规模达3042万。

24日，字节跳动旗下火山引擎于深圳举行人工智能（AI）创新巡展

不少业界人士表示，大模型为云服务带来重要变革和发展机遇。当前，大模型的价格不断降低、性能标准持续完善，伴随智能终端、汽车、零售大模型等的应用深化，AI正不断助力行业创新发展。多位业界专家建议，要不断推动大模型与实体业务结合、提升大模型性能，更好满足企业需求。

【责任编辑:周靖杰】

阅读下一篇：

本文仅代表作者观点，不代表xx立场。
本文系作者授权xxx发表，未经许可，不得转载。