扩散模型图像生成及超分论文(顶会顶刊2022-2024)

1.MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model

基于条件扩散模型的医学图像分割

内容与创新点:

提出了第一个基于DPM的通用医学图像分割任务模型,将其命名为 MedSegDiff。为了提高医学图像分割中DPM的分步区域注意,提出了动态条件编码方法,为每一步采样建立状态自适应条件。进一步提出了特征频率分析器(FF-Parser),以消除高频噪声成分在此过程中的负面影响。

论文地址:(V2版)[2301.11798] MedSegDiff-V2: Diffusion based Medical Image Segmentation with Transformer (arxiv.org)

[2211.00611] MedSegDiff: Medical Image Segmentation with Diffusion Probabilistic Model (arxiv.org)

论文代码:KidsWithTokens/MedSegDiff: Medical Image Segmentation with Diffusion Model (github.com)

2.Activating More Pixels in Image Super-Resolution Transformer

激活更多像素的图像超分transformer

内容与创新点:

设计了一种HAT(混合注意力transformer),结合自注意力、通道注意力和设计的重叠交叉注意力,激活更多的像素以更好地重建。同任务预训练策略,进一步挖掘SR-Transformer的潜力。表明了大规模数据集预训练对任务的重要性。

论文地址:

[2205.04437] Activating More Pixels in Image Super-Resolution Transformer (arxiv.org)

论文代码:

XPixelGroup/HAT: CVPR2023 - Activating More Pixels in Image Super-Resolution Transformer Arxiv - HAT: Hybrid Attention Transformer for Image Restoration (github.com)

3.ResShift: Efficient Diffusion Model for Image  Super-resolution by Residual Shifting

通过残差转移实现高效扩散模型超分

内容与创新点:

为了解决采样(推理)速度慢,模型计算量大的问题,本文提出了ResShift方法,该方法将扩散模型最终步由白噪声转变为LR图像,同时是在Latent Space空间进行该操作,两个操作都有效降低了计算量,加快了推理速度,同时该方法提出了一个噪声表(schedule),能够有效控制扩散过程中的噪声强度和转换速度,也可有效控制保真度-真实性trade-off。

论文地址:

[2307.12348] ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting (arxiv.org)

论文代码:

zsyOAOA/ResShift: ResShift: Efficient Diffusion Model for Image Super-resolution by Residual Shifting (NeurIPS 2023 Spotlight) (github.com)

4.High-Resolution Image Synthesis with Latent Diffusion Models

潜扩散模型实现高质量图像生成

内容与创新点:

Latent Diffusion Models通过在一个潜在表示空间中迭代“去噪”数据来生成图像,然后将表示结果解码为完整的图像。论文提出一种在潜在表示空间(latent space)上进行diffusion过程的方法,从而能够大大减少计算复杂度,同时也能达到十分不错的图片生成效果。相比于其它空间压缩方法,论文提出的方法可以生成更细致的图像,并且在高分辨率图片生成任务上表现得也很好。

论文地址:

[2112.10752] High-Resolution Image Synthesis with Latent Diffusion Models (arxiv.org)

论文代码:

CompVis/latent-diffusion: High-Resolution Image Synthesis with Latent Diffusion Models (github.com)

5.Exploiting Diffusion Prior for Real-World Image Super-Resolution

利用扩散先验进行真实世界的图像超分辨率

内容与创新点:

首先微调附加到固定预训练扩散模型的时间感知编码器。特征与可训练的空间特征变换 (SFT) 层相结合。这种设计能够利用图像 SR 的扩散先验。引入了一个可控的特征包装(CFW)模块,给定LR特征的信息Fe和来自固定解码器的特征Fd,以残差的方式获得一个调优的特征Fm。使用可调系数 w,CFW 可以在质量和保真度之间进行权衡。

论文地址:

[2305.07015] Exploiting Diffusion Prior for Real-World Image Super-Resolution (arxiv.org)

论文代码:

IceClear/StableSR: Exploiting Diffusion Prior for Real-World Image Super-Resolution (github.com)

以后会继续更新更多优质文章,感谢支持~

  • 25
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值