论文学习笔记 Spatial Attention Pyramid Network forUnsupervised Domain Adaptation(2020ECCV )
相关的知识点(需要额外学习的)
1 spatial pyramid pooling (SPP)
参考https://blog.csdn.net/weixin_48167570/article/details/120922689
kaiming提出的,主要用于解决之前图片尺寸不同, cropping or warping会扭曲原始的图像
SPP使用不同的尺寸进行池化,最终得到多个固定尺寸的张量,再使用全连接层进行操作
对比SAP SPP差异 1平均池化替代最大池化 2,这在消融实验中得到了证明。第二,SPP将只有几个窗口大小的特征集合起来,并将它们连接起来以生成固定长度的表示;而SAP旨在捕获金字塔中所有级别的多尺度上下文信息
2 RPN:Region Proposal Networks (区域候选网络)
Faster R-CNN使用区域建议网络(RPN)预测类别不可知的粗略对象建议,然后提取固定大小的对象特征,以分类对象类别并细化对象位置。
参考 https://blog.csdn.net/qq314000558/article/details/82082911
https://zhuanlan.zhihu.com/p/391562984
anchors,实际上就是一组由rpn/generate_anchors.py生成的矩形 对于每个特征层的点,按照固定的比例和尺寸生成
Region Proposal Networks。RPN网络用于生成region proposals。该层通过softmax判断anchors属于positive或者negative,再利用bounding box regression修正anchors获得精确的proposals。
3 attention:理解可以参考DANet
参考 https://blog.csdn.net/xijuezhu8128/article/details/111163373
模型的总体介绍
个人觉得,有点像RPN,SPP,attention的结合改良体
loss:
loss分为两部分,一个是任务本身的loss,另一个是对抗损失,但这个对抗,source和target是分开进行的,没有交互,就是backbone生成的adaptation_feature经过netD,将source和target分别设为0和1,与这个0或者1的标签做loss
(结合了论文和代码,自己随手画的草纸图。。)