Self-Attention Generative Adversarial Networks 论文解读

最新推荐文章于 2024-10-10 07:31:14 发布

zhangyumengs

最新推荐文章于 2024-10-10 07:31:14 发布

阅读量1.5w

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangyumengs/article/details/80555523

版权

本文介绍了一种新的GAN架构，该架构结合了注意力机制，并在生成器中应用了SNGAN的思想。通过在中间层引入注意力层，模型可以更好地捕捉图像中的依赖关系。实验表明这种方法在图像生成任务中取得了很好的效果。

摘要由CSDN通过智能技术生成

论文地址：https://arxiv.org/abs/1805.08318

Ian goodfellow 2018年新作，在GAN生成中加入了attention的机制，同时将SNgan的思想引入到生成器当中。

传统gan的问题

使用小的卷积核很难发现图像中的依赖关系

使用大的卷积核就丧失了卷积网络参数与计算的效率

attention层详解

就是在前一层的feature maps 上加入attention机制，使得gan在生成时能够区别不同的feature maps，

Wf Wg 都是网络的参数

softmax 来得到attention map。

通过下面的式子进行融合得到加入了attention机制的feature maps。

再讲这些featuremaps 加入到之前的featuremaps当中。

γ的值初始化为0，再逐渐增大权重，这里的意思就是一开始attention可能训练的不太好用attention来指引效果不好等 attention层训练得原来越好之后加大它的权重

作者引用了sngan的思想不仅在discrimator中将权重除以权重矩阵的特征值在generator中也做同样的处理，得到了不错的效果。具体思想参考论文SNGAN。

作者还讨论了attention机制加载网络的哪一层效果最好

作者指出在一些中层次或者高层次特征使用attention层能取得更好的效果。

与ACGan SNgan做的对比。

关注

1
点赞
踩
27

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。