Text to image论文精读DR-GAN：分布正则化的生成对抗网络 Distribution-Regularization-for-Text-to-Image-Generation(1)

2401_84181164

于 2024-05-06 14:56:06 发布

阅读量712

点赞数 16

分类专栏：程序员文章标签：生成对抗网络人工智能神经网络

本文链接：https://blog.csdn.net/2401_84181164/article/details/138495309

版权

本文介绍了如何通过系统化的在线学习资源，帮助IT从业者提升技术能力，强调了知识体系的重要性以及加入技术交流社区的价值。文章详细讨论了RIRM、SDM和DNM等技术在生成和鉴别图像过程中的作用，以及VAE和GAN在损失函数中的应用。

摘要由CSDN通过智能技术生成

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

)

\operatorname{Mask}_{i}^{Q}=\operatorname{Sig} \cdot\left(\operatorname{Conv}_{1 \times 1}^{2}\left(\operatorname{ReLU}\left(\operatorname{Conv}_{3 \times 3}^{1}\left(Q_{i}\right)\right)\right)\right)

MaskiQ=Sig⋅(Conv1×12(ReLU(Conv3×31(Qi))))

RIRM实数图像重建模块:包含一个编码器和一个解码器。编码器以实像

∗

I_i^*

Ii∗作为输入，输出实像特征

∗

H_i^*

Hi∗。解码器取实像特征

∗

H_i^*

Hi∗，利用重构损失函数

∥

(

∗

)

−

∗

∥

\left|R I R M\left(I_{i}^{{*}\right)-I_{i}}{*}\right|_{1}

∥RIRM(Ii∗)−Ii∗∥1对实像进行重构，解码器和生成模块

G^0

G0组成了Siamese网络，可以为SDM提供高质量的真实图像特征。

Semantic Disentangling Loss 语义解缠损失：为了驱动SDM更好地区分

Q_i

Qi和

−

H_{i−1}

Hi−1的关键信息和非关键信息。作者进一步设计了一个新的语义解缠损失(SDL)，对于图像特征和上下文特征：

(

∥

(

)

−

(

∗

)

∥

−

∥

(

−

)

−

(

∗

)

∥

)

(

∥

(

)

−

(

∗

)

∥

−

∥

(

−

)

−

(

∗

)

∥

)

\begin{aligned} \mathcal{L}_{S D L}^{H_{i}}= & S P\left(\left|\mu\left(H_{i}^{{+}\right)-\mu\left(H_{i}}{*}\right)\right|-\left|\mu\left(H_{i}^{{-}\right)-\mu\left(H_{i}}{*}\right)\right|\right)+S P\left(\left|\sigma\left(H_{i}^{{+}\right)-\sigma\left(H_{i}}{*}\right)\right|-\left|\sigma\left(H_{i}^{{-}\right)-\sigma\left(H_{i}}{*}\right)\right|\right) \end{aligned}

LSDLHi=SP(

μ(Hi+)−μ(Hi∗)

−

μ(Hi−)−μ(Hi∗)

)+SP(

σ(Hi+)−σ(Hi∗)

最低0.47元/天解锁文章

2401_84181164

关注

16
点赞
踩
24

收藏

觉得还不错? 一键收藏
0
评论
Text to image论文精读DR-GAN：分布正则化的生成对抗网络 Distribution-Regularization-for-Text-to-Image-Generation(1)

Ii∗I_i^*Ii∗作为输入，输出实像特征Hi∗H_i^*Hi∗。解码器取实像特征Hi∗H_i^*Hi∗，利用重构损失函数∥RIRMIi∗−Ii∗∥1∥RIRM(Ii∗)−Ii∗∥1对实像进行重构，解码器和生成模块G0G^0G0组成了Siamese网络，可以为SDM提供高质量的真实图像特征。QiQ_iQi和Hi−1H_{i−1}Hi−1的关键信息和非关键信息。
复制链接

扫一扫