快速发布求购| | | | | 加微群|
关注我们
本站客户服务

线上客服更便捷

仪表网官微

扫一扫关注我们

|
客户端
仪表APP

安卓版

仪表手机版

手机访问更快捷

仪表小程序

更多流量 更易传播


您现在的位置:仪表网>电力设备>资讯列表>科学岛团队提出面向扩散变换器的可控图像生成方案

科学岛团队提出面向扩散变换器的可控图像生成方案

2025年11月28日 10:20:26 人气: 14760 来源: 合肥物质科学研究院
  【仪表网 研发快讯】近期,中国科学院合肥物质院智能所谢成军与张洁团队基于控制条件相关性分析,设计了面向扩散变换器的可控图像生成方案,相关研究成果以RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers为题被AI领域CCF-A类会议Proceedings of the AAAI Conference on Artificial Intelligence (AAAI26)接收。
 
  扩散变换器(Diffusion Transformer)近年来在文本生成图像、文本生成视频等任务中发挥着核心作用,其优越的可扩展性显著推动了生成模型的发展。然而,现有可控扩散变换器方法往往依赖笨重的控制分支,引入大量参数与计算开销,同时普遍忽视了不同Transformer层对控制信息敏感度存在的差异,导致资源分配低效、算力利用不足等问题。
 
  针对上述挑战,研究团队提出了相关性引导的高效可控生成框架 RelaCtrl,在不牺牲生成质量的前提下,以更加精炼、智能的方式将控制信号融入扩散变换器。该框架首先定义并计算“ControlNet相关性得分”,通过在推理阶段逐层跳过控制分支,系统评估各层控制对最终图像质量和控制精度的影响。基于这一度量,RelaCtrl 可自适应调整控制层的插入位置、参数规模与建模能力,有效削减冗余参数与重复计算,在控制能力与资源利用之间实现动态平衡。在结构设计上,团队进一步以精心设计的二维随机混合模块(TDSM)替代传统复制模块中的自注意力机制和前馈网络(FFN),构建高效的词元混合器与通道混合器,在保持表达能力的同时大幅压缩计算成本。实验结果表明,与典型 ControlNet 方法相比,RelaCtrl 仅以约 15% 的参数量和计算复杂度即可获得更优的生成表现,在多项定性与定量指标上均展现出显著优势。
 
  硕士研究生曹可为论文第一作者,张洁副研究员为论文通讯作者。该工作在显著降低参数量与计算成本的同时保持生成质量,为AIGC领域提供了更高效、轻量化的可控生成解决方案。
 
图 1 可控图像生成方案架构图
 
图 2 相关性曲线的实验结果
 
表1 模型在不同控制条件下的实验结果
 
图 3 不同可控生成方法的定性比较结果
关键词: 扩散变换器
全年征稿/资讯合作 联系邮箱:ybzhan@vip.qq.com
版权与免责声明
1、凡本网注明"来源:仪表网"的所有作品,版权均属于仪表网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明"来源:仪表网"。违反上述声明者,本网将追究其相关法律责任。
2、本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
3、如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。
4、合作、投稿、转载授权等相关事宜,请联系本网。

企业推荐

更多
联系我们

客服热线: 0571-87759942

加盟热线: 0571-87756399

媒体合作: 0571-87759945

投诉热线: 0571-87759942

关注我们
  • 下载仪表站APP

  • Ybzhan手机版

  • Ybzhan公众号

  • Ybzhan小程序