《Multi-Label Image Classification with Attention Mechanism and Graph Convolutional Networks》MM2019

在这里插入图片描述

论文链接:https://dl.acm.org/doi/pdf/10.1145/3338533.3366589

  1. 解决的问题
    作者认为单纯考虑labels之间的关系并结合图像全局信息是不准确的,应该不仅考虑labels之间的关系,同时将每个label和图像上其目标相对应区域之间的联系也考虑进来。

  2. 解决方法
    本文提出一个新的框架,同时使用attention机制和GCN。Attention机制关注特定目标区域,增强图像区域和label之间的联系;利用label共现概率构建label之间的有向图,利用GCN从全局视角学习labels之间的关系,即为每个label学习一个分类器。
    在这里插入图片描述

  3. 整体框架
    在这里插入图片描述

  • Feature Extraction Net
    使用ResNet-101作为特征提取网络,使I表示输入图像,对应标签为在这里插入图片描述
    其中C是数据集中所有标签的数目,如果图像标签是l,则其对应标签y^l = 1,否则为0。
    特征提取过程记为(输出的feature map):在这里插入图片描述
  1. Attention Mechanism Net
    在这里插入图片描述给定输入视觉特征(上述公式1获得)f_a,注意力模块可以生成label attention values:在这里插入图片描述
    其中blocks模块由ResNet的conv5.x相关的两个残差单元组成,C是整个label数目,最后Z应该包含C个attention map。
    最后通过特征提取网络的输出和attention机制网络融合得到最终的特征:
    在这里插入图片描述
    其中α是权重因子。

  2. GCN Classification Net

  • 每层GCN非线性函数:在这里插入图片描述
    其中H^(l+1)表示被更新的节点表示,而H表示输入的节点表示;A是相应的相关矩阵;d是当前节点特征维度。f(., .)表示为:在这里插入图片描述
    其中A^~表示正则化后的相关矩阵。
  • 本篇论文,其中相关矩阵,它是通过在训练集中以条件概率建模获得的,使用词向量作为标签表示(与工作【1】一致),将学习到的分类器应用到图像表达,scores表示为:在这里插入图片描述
    其中在这里插入图片描述,同时f(.)指全局最大池化操作。
  • loss函数:在这里插入图片描述
    其中σ(·)是sigmoid函数。
  1. 实验结果
  • 最新方法对比
    在这里插入图片描述
  • attention模块可视化分析
    在这里插入图片描述
  • 整个框架实验可视化分析
    在这里插入图片描述
  1. 结论
    这篇论文与ML-GCN【1】非常相似,唯一的区别就是本文利用attention机制去关注每个label对应的特定目标区域,然后与GCN分类网络学习的label分类器结合,但是实验结果对比效果相较于ML-GCN提升不大,个人觉得创新性不是很大(纯属个人想法,有问题还请指出!!)

参考文献:
[1] Zhao-Min Chen, Xiu-Shen Wei, Peng Wang, and Yanwen Guo. 2019. Multi-LabelImage Recognition with Graph Convolutional Networks. InProceedings of theIEEE Conference on Computer Vision and Pattern Recognition. 5177–5186

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
很抱歉,根据提供的引用内容,我无法提供关于"SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS"代码的信息。引用的内容主要介绍了图上结点分类的半监督问题以及相关的研究方法和改进。如果您需要获取该代码,建议您查阅相关的学术论文或者在开源代码平台上搜索相关的项目。 #### 引用[.reference_title] - *1* [Semi-supervised classification with graph convolutional networks](https://blog.csdn.net/weixin_41362649/article/details/113232898)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [Kipf-GCN《Semi-Supervised Classification With Graph Convolutional Networks》论文详解](https://blog.csdn.net/u012762410/article/details/127177181)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Semi-Supervised Classification with Graph Convolutional Networks](https://blog.csdn.net/m0_37924639/article/details/124884547)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值