首页 财经 理财 产业 商业 证券 消费 图片 视频 全国

科技

旗下栏目: 科技 汽车 房产 工农

小红书 AIGC 团队提出布局控制生成新算法 InstanceAssemble

来源: 作者:碧海醫心 人气: 发布时间:2025-12-25
摘要:小红书AIGC团队正式发布全新布局可控图像生成框架InstanceAssemble,专为解决高难度、多对象复杂场景下的Layout-to-Image生成任务而设计。该框架采用级联式建模架构,将文本语义理解与空间布局约束分阶段协同处理,并创新性地提出Assemble-Attention机制,显

小红书 aigc 团队正式发布全新布局可控图像生成框架 instanceassemble,专为解决高难度、多对象复杂场景下的 layout-to-image 生成任务而设计。

该框架采用级联式建模架构,将文本语义理解与空间布局约束分阶段协同处理,并创新性地提出 Assemble-Attention 机制,显著增强模型在密集实例、多目标共存布局中的空间感知能力与像素级对齐精度。

此外,InstanceAssemble 仅需极小规模的 LoRA 微调(参数量占比:SD3-Medium 仅 3.46%,Flux.1 仅 0.84%),即可在不损害原始基础模型性能的前提下,高效支持文本描述 参考图像的双模态联合控制。团队同步构建了面向高密度布局的 DenseLayout 新型评测基准,并提出具备强可解释性的布局对齐评估指标 LGS,全面提升布局一致性评估的准确性与可信度。

Figma Slides

Figma Slides 是 Figma 发布的PPT制作和演示文稿生成工具,可以帮助创建、设计、定制和分享演示文稿

下载

实验结果表明,InstanceAssemble 在各类复杂布局测试中展现出优异的稳定性与泛化能力,图像生成质量与布局控制精度均处于当前行业前沿水平。

论文标题:InstanceAssemble: Layout-Aware Image Generation via Instance Assembling Attention
论文链接:https://www.php.cn/link/e74186a9024394af6d13cb98b343f11a
项目主页:https://www.php.cn/link/3dff232f506693720caae97d135faa54

源码地址:点击下载

责任编辑:碧海醫心

上一篇:三星有望为 xAI 代工 Grok 的人工智能芯片

下一篇:没有了

首页 | 财经 | 理财 | 产业 | 商业 | 证券 | 消费 | 图片 | 视频 | 全国

Copyright 2025 九掌金融版权所有  技术支持:政产学研(海南)投资有限公司 备案号:琼ICP备2025065810号-1

电脑版 | 移动版