Learning to Discover Multi-Class Attentional Regions for Multi-Label Image Recognition 模型个人理解
直接上模型图:
这个论文的创新点在于,利用The class activation mapping method提取出了每一个类别的热图,然后利用热图从原图中粗略的抠出来此类别的局部图像。通入和全局图像共享的特征提取网络。当然,全局图像和局部图像出来的结果需要分开计算loss,局部图像只用计算这个图像在此类的计算上的loss,全局图像需要计算在所有类别上的loss。(个人感觉类似于注意力机制)
论文地址:链接: lhttps://arxiv.org/pdf/2007.01755.pdf.
关于生成热图的论文地址:
链接: https://www.cv-foundation.org/openaccess/content_cvpr_2016/papers/Zhou_Learning_Deep_Features_CVPR_2016_paper.pdf