火山引擎发布视频生成模型

2024年09月25日 | 小微 | 浏览量:60162

火山引擎发布视频生成模型
图片来源于网络,如有侵权,请联系删除

  新华社客户端深圳9月25日电(记者孙飞)24日,在字节跳动旗下火山引擎于深圳举行的人工智能(AI)创新巡展上,火山引擎发布了豆包视频生成模型,具有一致性多镜头生成、动态运镜、支持3D动画等功能。当日,火山引擎还发布了音乐模型、同声传译模型,升级通用语言模型、文生图模型、语音模型等。

  火山引擎方面介绍,豆包视频生成模型可让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法,攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性。

  火山引擎总裁谭待说,视频生成有很多难关亟待突破,豆包模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。

  24日,字节跳动还发布了豆包全模态大模型家族。统计数据显示,豆包大模型今年5月发布以来,语言模型日均使用量不断增加,图片、语音等多模态数据处理量大幅提升。第三方机构QuestMobile数据显示,截至7月,豆包月活用户规模达3042万。

24日,字节跳动旗下火山引擎于深圳举行人工智能(AI)创新巡展

  不少业界人士表示,大模型为云服务带来重要变革和发展机遇。当前,大模型的价格不断降低、性能标准持续完善,伴随智能终端、汽车、零售大模型等的应用深化,AI正不断助力行业创新发展。多位业界专家建议,要不断推动大模型与实体业务结合、提升大模型性能,更好满足企业需求。

【责任编辑:周靖杰】
    阅读下一篇:
              版权声明

              本文仅代表作者观点,不代表xx立场。
              本文系作者授权xxx发表,未经许可,不得转载。

              标签列表