首页 财经 理财 产业 商业 证券 消费 图片 视频 全国

科技

旗下栏目: 科技 汽车 房产 工农

可灵AI O1正式上线:号称全球首个统一多模态视频大模型

来源: 作者:网络 人气: 发布时间:2025-12-30
摘要:可灵AI正式发布全新O1视频大模型,被誉为全球首个统一多模态视频大模型。该模型基于创新的多模态视觉语言交互架构,用户可在单一输入框内无缝融合文字、图像、视频等多种指

12月2日 消息:可灵AI正式宣布其全新O1视频大模型全量上线,这款被业界誉为“全球首个统一多模态视频大模型”的创新产品,凭借其突破性的技术架构和功能设计,直击传统视频生成工具功能割裂、操作复杂的行业痛点,为视频创作领域带来革命性变革。目前,用户已可在可灵App及官网率先体验这一前沿科技。

 

与传统视频生成工具需分步处理文生视频、图生视频、局部编辑等任务不同,可灵O1基于创新的MVL(多模态视觉语言)交互架构,在单一输入框内即可无缝融合文字、图像、视频等多种指令,实现跨模态内容的无缝衔接与高效创作。这一设计极大地简化了操作流程,提升了创作效率。

结合先进的Chain-of-thought技术,可灵O1不仅能够精准理解用户意图,还能进行常识推理与事件推演,确保生成的视频内容更加符合逻辑、贴近现实。例如,用户上传一段真人视频后,仅需通过简单对话指令,即可实现局部元素的增加或删除、前后镜头的智能延展以及动作捕捉生成新画面等高级功能,让视频创作变得更加灵活多样。

 

尤为值得一提的是,可灵O1通过多视角主体构建技术,成功攻克了视频中人物或物体在镜头切换时特征漂移的行业难题。这一技术确保了多主体场景下画面的精准连贯性,为视频创作提供了更加稳定可靠的技术支持。

此外,可灵O1还支持长达310秒的自由生成时长,将叙事节奏的控制权完全交还给创作者。无论是短视频博主、广告团队还是个人用户,都能借助这一平台快速产出高质量、高一致性的创意视频,满足多样化的创作需求。

 

责任编辑:网络
首页 | 财经 | 理财 | 产业 | 商业 | 证券 | 消费 | 图片 | 视频 | 全国

Copyright 2025 九掌金融版权所有  技术支持:政产学研(海南)投资有限公司 备案号:琼ICP备2025065810号-1

电脑版 | 移动版