扩散模型图像生成及超分论文（顶会顶刊2022-2024）

ZH3nGsQ-OvO

已于 2024-05-17 15:59:16 修改

阅读量766

点赞数 25

文章标签：计算机视觉人工智能 stable diffusion

于 2024-05-17 15:57:36 首次发布

本文链接：https://blog.csdn.net/m0_59430407/article/details/139006506

版权

1.MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model

基于条件扩散模型的医学图像分割

内容与创新点：

提出了第一个基于DPM的通用医学图像分割任务模型，将其命名为 MedSegDiff。为了提高医学图像分割中DPM的分步区域注意，提出了动态条件编码方法，为每一步采样建立状态自适应条件。进一步提出了特征频率分析器（FF-Parser），以消除高频噪声成分在此过程中的负面影响。

论文地址：（V2版）[2301.11798] MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer (arxiv.org)

[2211.00611] MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model (arxiv.org)

论文代码：KidsWithTokens/MedSegDiff: Medical Image Segmentation with Diffusion Model (github.com)

2.Activating More Pixels in Image Super-Resolution Transformer

激活更多像素的图像超分transformer

内容与创新点：

设计了一种HAT（混合注意力transformer），结合自注意力、通道注意力和设计的重叠交叉注意力，激活更多的像素以更好地重建。同任务预训练策略，进一步挖掘SR-Transformer的潜力。表明了大规模数据集预训练对任务的重要性。

论文地址：

[2205.04437] Activating More Pixels in Image Super-Resolution Transformer (arxiv.org)

论文代码：

XPixelGroup/HAT: CVPR2023 - Activating More Pixels in Image Super-Resolution Transformer Arxiv - HAT: Hybrid Attention Transformer for Image Restoration (github.com)

3.ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting

通过残差转移实现高效扩散模型超分

内容与创新点：

为了解决采样（推理）速度慢，模型计算量大的问题，本文提出了ResShift方法，该方法将扩散模型最终步由白噪声转变为LR图像，同时是在Latent Space空间进行该操作，两个操作都有效降低了计算量，加快了推理速度，同时该方法提出了一个噪声表（schedule），能够有效控制扩散过程中的噪声强度和转换速度，也可有效控制保真度-真实性trade-off。

论文地址：

[2307.12348] ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting (arxiv.org)

论文代码：

zsyOAOA/ResShift: ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting (NeurIPS 2023 Spotlight) (github.com)

4.High-Resolution Image Synthesis with Latent Diffusion Models

潜扩散模型实现高质量图像生成

内容与创新点：

Latent Diffusion Models通过在一个潜在表示空间中迭代“去噪”数据来生成图像，然后将表示结果解码为完整的图像。论文提出一种在潜在表示空间（latent space）上进行diffusion过程的方法，从而能够大大减少计算复杂度，同时也能达到十分不错的图片生成效果。相比于其它空间压缩方法，论文提出的方法可以生成更细致的图像，并且在高分辨率图片生成任务上表现得也很好。

论文地址：

[2112.10752] High-Resolution Image Synthesis with Latent Diffusion Models (arxiv.org)

论文代码：

CompVis/latent-diffusion: High-Resolution Image Synthesis with Latent Diffusion Models (github.com)

5.Exploiting Diffusion Prior for Real-World Image Super-Resolution

利用扩散先验进行真实世界的图像超分辨率

内容与创新点：

首先微调附加到固定预训练扩散模型的时间感知编码器。特征与可训练的空间特征变换 (SFT) 层相结合。这种设计能够利用图像 SR 的扩散先验。引入了一个可控的特征包装(CFW)模块，给定LR特征的信息Fe和来自固定解码器的特征Fd，以残差的方式获得一个调优的特征Fm。使用可调系数 w，CFW 可以在质量和保真度之间进行权衡。

论文地址：

[2305.07015] Exploiting Diffusion Prior for Real-World Image Super-Resolution (arxiv.org)

论文代码：

IceClear/StableSR: Exploiting Diffusion Prior for Real-World Image Super-Resolution (github.com)

以后会继续更新更多优质文章，感谢支持~

ZH3nGsQ-OvO

关注

25
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
扩散模型图像生成及超分论文（顶会顶刊2022-2024）

为了解决采样（推理）速度慢，模型计算量大的问题，本文提出了ResShift方法，该方法将扩散模型最终步由白噪声转变为LR图像，同时是在Latent Space空间进行该操作，两个操作都有效降低了计算量，加快了推理速度，同时该方法提出了一个噪声表（schedule），能够有效控制扩散过程中的噪声强度和转换速度，也可有效控制保真度-真实性trade-off。引入了一个可控的特征包装(CFW)模块，给定LR特征的信息Fe和来自固定解码器的特征Fd，以残差的方式获得一个调优的特征Fm。论文地址：（V2版）
复制链接

扫一扫

扩散模型图像生成及超分论文（顶会顶刊2022-2024）

“相关推荐”对你有帮助么？