Text to image论文精读DR-GAN:分布正则化的生成对抗网络 Distribution-Regularization-for-Text-to-Image-Generation(1)

本文介绍了如何通过系统化的在线学习资源,帮助IT从业者提升技术能力,强调了知识体系的重要性以及加入技术交流社区的价值。文章详细讨论了RIRM、SDM和DNM等技术在生成和鉴别图像过程中的作用,以及VAE和GAN在损失函数中的应用。
摘要由CSDN通过智能技术生成

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

)

)

)

\operatorname{Mask}_{i}^{Q}=\operatorname{Sig} \cdot\left(\operatorname{Conv}_{1 \times 1}^{2}\left(\operatorname{ReLU}\left(\operatorname{Conv}_{3 \times 3}^{1}\left(Q_{i}\right)\right)\right)\right)

MaskiQ​=Sig⋅(Conv1×12​(ReLU(Conv3×31​(Qi​))))

  • RIRM实数图像重建模块:包含一个编码器和一个解码器。编码器以实像

I

i

I_i^*

Ii∗​作为输入,输出实像特征

H

i

H_i^*

Hi∗​。解码器取实像特征

H

i

H_i^*

Hi∗​,利用重构损失函数

R

I

R

M

(

I

i

)

I

i

1

\left|R I R M\left(I_{i}{*}\right)-I_{i}{*}\right|_{1}

∥RIRM(Ii∗​)−Ii∗​∥1​对实像进行重构,解码器和生成模块

G

0

G^0

G0组成了Siamese网络,可以为SDM提供高质量的真实图像特征。

  • Semantic Disentangling Loss 语义解缠损失:为了驱动SDM更好地区分

Q

i

Q_i

Qi​和

H

i

1

H_{i−1}

Hi−1​的关键信息和非关键信息。作者进一步设计了一个新的语义解缠损失(SDL),对于图像特征和上下文特征:

L

S

D

L

H

i

=

S

P

(

μ

(

H

i

)

μ

(

H

i

)

μ

(

H

i

)

μ

(

H

i

)

)

S

P

(

σ

(

H

i

)

σ

(

H

i

)

σ

(

H

i

)

σ

(

H

i

)

)

\begin{aligned} \mathcal{L}_{S D L}^{H_{i}}= & S P\left(\left|\mu\left(H_{i}{+}\right)-\mu\left(H_{i}{*}\right)\right|-\left|\mu\left(H_{i}{-}\right)-\mu\left(H_{i}{*}\right)\right|\right)+S P\left(\left|\sigma\left(H_{i}{+}\right)-\sigma\left(H_{i}{*}\right)\right|-\left|\sigma\left(H_{i}{-}\right)-\sigma\left(H_{i}{*}\right)\right|\right) \end{aligned}

LSDLHi​​=​SP(

​μ(Hi+​)−μ(Hi∗​)

​−

​μ(Hi−​)−μ(Hi∗​)

​)+SP(

​σ(Hi+​)−σ(Hi∗​)

  • 16
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值