首页 财经 理财 产业 商业 证券 消费 图片 视频 全国

科技

旗下栏目: 科技 汽车 房产 工农

字节跳动与南洋理工大学开源 StoryMem 框架

来源: 作者:聖光之護 人气: 发布时间:2025-12-29
摘要:字节跳动携手南洋理工大学共同推出开源AI视频生成框架StoryMem,创新性地引入“Memory-to-Video(M2V)”机制,成功将传统单镜头扩散模型拓展为可生成多镜头、时长超1分钟且叙事流畅的长视频生成系统。该框架采用动态记忆库存储关键帧语义与视觉特征,并融合

字节跳动携手南洋理工大学共同推出开源ai视频生成框架storymem,创新性地引入“memory-to-video(m2v)”机制,成功将传统单镜头扩散模型拓展为可生成多镜头、时长超1分钟且叙事流畅的长视频生成系统。

该框架采用动态记忆库存储关键帧语义与视觉特征,并融合轻量级LoRA微调策略,在人物形象、场景风格及情节发展等维度实现跨镜头高度统一,整体一致性指标相较当前主流方法提升29%。

项目开源地址:https://www.php.cn/link/52bd90a3be645143af3c4ad082803269

MakeSong

AI音乐生成,生成高质量音乐,仅需30秒的时间

下载

同步发布的ST-Bench评测数据集涵盖300组多镜头故事提示,全面支撑长视频生成效果的标准化评估。目前,社区已在ComfyUI平台中启动StoryMem技术集成工作。

源码地址:点击下载

责任编辑:聖光之護
首页 | 财经 | 理财 | 产业 | 商业 | 证券 | 消费 | 图片 | 视频 | 全国

Copyright 2025 九掌金融版权所有  技术支持:政产学研(海南)投资有限公司 备案号:琼ICP备2025065810号-1

电脑版 | 移动版