科灵AI推出支持多模态输入和对话式编辑的O1视频模型

据12月2日消息,科灵AI于12月1日正式宣布,将正式推出自主研发的O1视频大模型。该模型定位为集成的多模式创作工具,允许用户通过单个输入框集成文本、图像和视频命令来生成和编辑视频。据悉,科灵O1机型采用集成MVL(多模态视觉语言)交互架构,结合思维链推理技术,无需在不同功能模块之间切换,即可处理视频文声、视频图修、本地编辑、镜头扩展等多种任务。该技术采用多视角对象构建技术,解决视频生成过程中摄像机变化时人物和物体特征漂移的问题,提高图像一致性。目前科灵O1机型已在科灵APP和官网开放试用,并支持视频生成大约3到10秒的时间。主要针对短视频创作者、广告团队和个人用户。该公司表示,未来将开放API接口,用于第三方平台的集成。 (袁学礼)本文来自网易科技报道。关注我们以获取更多信息和深入内容。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注