CVPR 2023上AIGC大爆发!46篇论文、代码和数据集汇总

刚刚过去的几个月,无疑是生成式AI爆发的奇点。

说到生成式AI,就不得不提到AIGC。AIGC全称为AI-Generated Content,指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻找规律,并通过释放泛化能力生成相关技术的内容。

781b826f49e4b1efbe2c26ee565ff7a6.png

AIGC 在图像生成中的示例

虽然在文生图领域,扩散模型似乎已经一统天下,但GAN 依然存在不可磨灭的优势。这使得一些研究者在这一方向上持续努力,并取得了非常实用的成果,相关的论文已被 CVPR 2023 接收。

这次我整理了46篇【CVPR 2023的AIGC应用汇总】图像转换、翻译/可控文生图/图像恢复/语义布局可控生成/医学图像/face相关的基于diffusion扩散模型/GAN生成对抗方法论文合集+部分代码,我特地选了6篇具有代表性的文章为大家叙述,希望对在该领域想发论文的同学带来一些新思路!

并且今天免费为大家送一波福利
扫描二维码,回复【GAN】
领取
46篇CVPR 2023 AIGC应用论文和部分代码合集
全是pdf格式,非常方便,想要的同学千万不要错过!

1e1f06ae305535b4abade6ade4f50389.gif

2c4890d0760448baec884b8c8daaa753.png

312a18bedf65701735385156fc847ac4.png

01

GAN的反击!朱俊彦新作GigaGAN,出图速度秒杀Stable Diffusion

题目:

1f8455a2f4e6948b8f56447d7c3eab6f.png

12c0a220e3616adc9599a5f58b8077b5.png

最近,文字-图像生成技术的成功已经席卷全球,激发了大众的想象力。从技术的角度来看,它也标志着设计生成图像模型所青睐的架构的巨大变化。GANs曾经是事实上的选择,有StyleGAN这样的优秀技术。随着DALL·e2的出现,自回归和扩散模型似乎一夜之间成为大规模生成模型的新标准。

CycleGAN 的主要作者、曾获 2018 年 ACM SIGGRAPH 最佳博士论文奖的朱俊彦是这篇 CVPR 论文的第二作者。

该研究首先使用 StyleGAN2 进行实验,并观察到简单地扩展主干网络会导致训练不稳定。基于此,研究者确定了几个关键问题,并提出了一种在增加模型容量的同时稳定训练的技术。

02

基于示例的图像转换的屏蔽和自适应变压器

题目:

44774b0dc52581996ec0d64ee0e61015.png

d2144465feedcad5b7aa029c3972401c.png

该论文提出了一个基于样本的图像转换新方法。用于此任务的先进方法主要集中在建立跨域语义对应上,但跨域语义匹配具有挑战性,匹配错误最终会降低生成图像的质量。

为了克服这一挑战,该论文提出了一种掩码和自适应变换器 (MAT),用于学习准确的跨域对应关系,并执行上下文感知特征增强。为了实现后者,使用样本的输入源特征和全局样式代码作为补充信息来解码图像。

此外,设计了一种新的对比风格学习方法,用于获取质量区分风格表示,这反过来有利于高质量图像的生成。实验结果表明在各种图像转换任务中表现更好。

03

具有列行纠缠像素合成的高效尺度不变生成器

题目:

57626c6b93c69b7c470a56df83bc87d6.png

2d6e97ca9c75ac7b0ab902d944ba15a5.png

该论文说明任意尺寸图像生成(Any-scale image synthesis)提供了一种高效和可扩展的解决方案,可以在任何比例下合成逼真的图像,甚至超过2K分辨率。

这项工作提出了列行耦合的像素生成(Column-Row Entangled Pixel Synthesis,CREPS),一种既高效又具有尺度等变性的新型生成模型,而不使用任何空间卷积或粗到细的设计。在各种数据集上的实验,包括FFHQ、LSUNChurch、MetFaces和Flickr-Scenery,证实了CREPS具有在任意任意分辨率下合成尺度一致图像的能力。

04

图像恢复,基于GAN生成对抗/diffusion扩散模型方法

题目:

be61e3081a3fb4a9d7595066bad39105.png

30348c67553c73983d8be23482e50590.png

该论文研究JPEG图像恢复问题,即加密比特流中的比特错误。比特错误会导致解码后的图像内容出现不可预测的色偏和块位移,这些问题无法通过现有的主要依赖于像素域中预定义退化模型的图像恢复方法来解决。该论文提出了一个强健的JPEG解码器,并采用两阶段补偿和对齐框架来恢复受比特流损坏的JPEG图像。

具体而言,JPEG解码器采用了一种具有容错机制的方法来解码受损的JPEG比特流。两阶段框架由自补偿和对齐(SCA)阶段和引导补偿和对齐(GCA)阶段组成。在三个不同比特错误率的基准测试上进行了实验。实验结果和消融研究表明了我们所提出的方法的优越性。

05

PosterLayout:内容感知视觉文本演示布局的新基准和方法

题目:

2e1a67769ee64712adad8d7169296128.png

4e6ddd62a0cc07ac2dfd86e5b24dea60.png

该论文提出了设计序列形成(DSF)方法,以模拟人类设计师的设计过程重新组织布局中的元素,并提出了一种基于CNN-LSTM的条件生成对抗网络(GAN)来生成适当的布局。具体来说,鉴别器是设计序列感知的,将监督生成器的“设计”过程。

实验结果验证了新基准的有用性和所提出方法的有效性,该方法通过为不同的画布生成适当的布局实现了最佳性能。

06

使用人脑活动的潜在扩散模型进行高分辨率图像重建

题目:

5ffb206b0291f8751f45a6d1506d1c38.png

8c1d164162a82e6edd042ef6cd3ce1d2.png

本文提出一种基于扩散模型(DM)的新方法,通过功能性磁共振成像(functional magnetic resonance imaging,fMRI)从人脑活动来重构出图像。通过研究LDM的不同组成部分(例如图像的潜在向量Z、条件输入C以及去噪U-Net的不同元素)与不同的脑功能之间的关系,表征了LDM的内部机制。

方法可以在简单的方式下重构具有高保真度的高分辨率图像,而不需要任何额外的训练和精调复杂的深度学习模型。还提供了从神经科学角度对不同LDM组件的定量解释。总体而言,研究提出了一种重构人类脑活动中图像的有前途的方法,并为理解DM提供了新的框架。

并且今天免费为大家送一波福利
扫描二维码,回复【GAN】
领取
46篇CVPR 2023 【AIGC应用论文+部分代码合集】
全是pdf格式,非常方便,想要的同学千万不要错过!

3bcaa1704fd818940201d5cf01063834.gif

1baa16520e1017d456b9bbbb1244aea8.png

02577f328f44c14a247f1ae26c148111.png

这次我还邀请了高级视觉算法研究员的吉米老师,用一小时的时间给大家做了一节《sota、difussion和GAN结合论文中稿的支撑点》课程,以《Generative Adversarial Nets》-NIPS2014论文为例,手把手教大家如何带入difussion学习和运用aigc技术发论文。

扫码解锁课程+领46篇论文合集+课程交流群

7450b60afb9200eb2cb395d0d98f2f40.png

9366f318edb59011a4ddc6d5723e97a5.png

包邮赠书福利

f483465d42bb104e46189f421483f990.jpeg

添加客服,凭当前文章截图参与抽奖送书。抽取50名同学,包邮送出《一本书读懂AIGC》

6a4d2d49d44b40aed5bf71ab7f2028ab.png

扫码回复“GAN

学课程、领论文、抽图书!

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CVPR 2023是计算机视觉和模式识别的顶级会议,UAV(无人机)在该会议上是一个热门的研究领域。 UAV(无人机)技术在过去几年中取得了显著的发展和广泛的应用。它们被广泛用于农业、测绘、监测和救援等领域。CVPR 2023将成为研究者们交流、展示和分享无人机相关研究的理想平台。 首先,CVPR 2023将提供一个特殊的无人机研究专题,以探讨该领域的最新进展和创新。研究人员可以提交和展示基于无人机的计算机视觉和模式识别的研究成果。这些研究可能涉及无人机导航、目标识别、图像处理等方面,以解决现实世界中的问题。 其次,CVPR 2023也将包括无人机在计算机视觉和模式识别中的应用研究。无人机可以提供独特的视角和数据采集能力,用于处理各种计算机视觉任务,如物体检测、场景分割等。研究者可以展示他们基于无人机的方法与传统方法的对比实验结果,并讨论无人机在这些领域的优势和局限性。 此外,CVPR 2023还将包括与无人机相关的新兴技术和趋势的讨论。例如,无人机与深度学习、增强现实等领域的结合,将推动计算机视觉和模式识别的研究和应用取得更大的突破。研究者可以分享他们在这些交叉领域中的创新成果,并与其他学者进行深入的讨论和合作。 总之,CVPR 2023将为无人机在计算机视觉和模式识别领域的研究提供一个重要的平台。它将促进学术界和工业界之间的合作与交流,并为未来的无人机技术发展提供新的思路和方向。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值