论文学习笔记 Spatial Attention Pyramid Network forUnsupervised Domain Adaptation(2020ECCV )

论文学习笔记 Spatial Attention Pyramid Network forUnsupervised Domain Adaptation(2020ECCV )

相关的知识点(需要额外学习的)

1 spatial pyramid pooling (SPP)

参考https://blog.csdn.net/weixin_48167570/article/details/120922689

kaiming提出的,主要用于解决之前图片尺寸不同, cropping or warping会扭曲原始的图像
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

SPP使用不同的尺寸进行池化,最终得到多个固定尺寸的张量,再使用全连接层进行操作

对比SAP SPP差异 1平均池化替代最大池化 2,这在消融实验中得到了证明。第二,SPP将只有几个窗口大小的特征集合起来,并将它们连接起来以生成固定长度的表示;而SAP旨在捕获金字塔中所有级别的多尺度上下文信息

2 RPN:Region Proposal Networks (区域候选网络)

Faster R-CNN使用区域建议网络(RPN)预测类别不可知的粗略对象建议,然后提取固定大小的对象特征,以分类对象类别并细化对象位置。

参考 https://blog.csdn.net/qq314000558/article/details/82082911
https://zhuanlan.zhihu.com/p/391562984

anchors,实际上就是一组由rpn/generate_anchors.py生成的矩形 对于每个特征层的点,按照固定的比例和尺寸生成

Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。

在这里插入图片描述

3 attention:理解可以参考DANet

参考 https://blog.csdn.net/xijuezhu8128/article/details/111163373

在这里插入图片描述
在这里插入图片描述

模型的总体介绍

个人觉得,有点像RPN,SPP,attention的结合改良体
在这里插入图片描述

loss:

loss分为两部分,一个是任务本身的loss,另一个是对抗损失,但这个对抗,source和target是分开进行的,没有交互,就是backbone生成的adaptation_feature经过netD,将source和target分别设为0和1,与这个0或者1的标签做loss

(结合了论文和代码,自己随手画的草纸图。。)

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值