图像生成
文章平均质量分 88
AIWalker-Happy
Happy专注于底层视觉处理,对基础AI技术保持学习心态
展开
-
CVPR2024 | 加速Diffusion,韩松团队提出分布式并行推理方案DistriFusion,加速6.1倍,质量不下降,已开源
扩散模型在合成高质量图像方面取得了巨大成功。然而,由于巨大的计算成本,利用扩散模型生成高分辨率图像仍然具有挑战性,导致交互式应用程序的延迟过高。在本文中,我们提出DistriFusion通过利用多个 GPU 的并行性来解决这个问题。我们的方法将模型输入拆分为多个块,并将每个块分配给GPU。然而,这样的算法最基本实现会破坏补丁之间的交互并失去保真度,而合并这样的交互将产生巨大的通信开销。为了克服这个困境,我们观察到相邻扩散步骤的输入之间的高度相似性,并提出置换补丁并行性。原创 2024-03-01 18:34:38 · 1362 阅读 · 0 评论 -
DiffiT | 英伟达提出用于图像生成的扩散ViT架构DiffiT,达成新SOTA!
本文首发于,欢迎关注。扩散模型以其强大的表达能力和高样本质量在许多领域得到了新的应用。对于样本生成,这些模型依赖于通过迭代去噪生成图像的去噪神经网络。然而,,大多数工作都依赖于卷积残差U-Nets。。本文提出一种新模型,称为扩散视觉transformer (DiffiT),由一个具有U形编码器和解码器的混合分层架构组成。本文提出。此外,本文还提出了LatentDiffiT,由transformer模型和所提出的自注意力层组成,用于高分辨率图像生成。结果表明,。在潜空间中,。原创 2024-02-27 12:29:13 · 805 阅读 · 0 评论