Diffusion 加速系列之一| T-Gate：Cross-Attention Makes Inference Cumbersome in Text-to-Image Diffusion Model

AI-Seeker

于 2024-05-24 23:51:00 发布

阅读量1.1k

点赞数 5

分类专栏： AIGC Diffusion 加速文章标签： AIGC

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/l1498487239/article/details/139186815

版权

0. 资源链接

论文: https://arxiv.org/pdf/2404.02747v1
代码: https://github.com/HaozheLiu-ST/T-GATE

1. 背景动机

现有的 diffusion model 推理存在以下问题：

一般 diffusion model 在推理过程需要经过多半去噪流程，其中通常为50~1000 步（当然现在的 LCM model 普遍能减少去噪步数），这样通常会导致生成一张图片耗时过长。
在 diffusion model 每一步的推理中，都注入了 condition 信息，但这是否在每一步是必须的仍然值得探索。

不过近年不少工作在深入研究 diffusion model 加速，取得不少的成果：

一类是 fast sampler 方法如 PLMS，DDIM，DPM solver 等方法可以以更少的采样步数来加速模型推理。
一类是结构优化：通过设计更高效的结构或者是传统的剪枝方案来提高模型的推理速度。
一类是利用去噪步间的相似 feature 来减少冗余计算如 DeepCache，提高模型推理速度。

2. 内容提要

分析 cross-attention 在整个推理所有的去噪时间步的影响，认为 cross-attention 在去噪多步去噪过程中会收敛，在后面的去噪时间步中 cross-attention 的 map 图和前面时间步的差别很小，所以这些计算是冗余的。

最低0.47元/天解锁文章

博客等级

码龄11年

22
原创

295
点赞

339
收藏

228
粉丝

关注

私信

热门文章

分类专栏

最新评论

AIGC前沿 | LivePortrait
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619286389。
AIGC前沿 | LivePortrait
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619284773。
AIGC前沿 | LivePortrait
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619282126。
AIGC前沿 | LivePortrait
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619279525。
AIGC前沿 | LivePortrait
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN月度精选】榜单，全部的排名请看 https://bbs.csdn.net/topics/619206080。

大家在看

【教程4＞第7章＞第1节】信道编译码概述

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。