【paper】Semantic Object Parsing with Graph LSTM阅读笔记

本文介绍了使用Graph LSTM进行语义对象解析的方法,通过结合LSTM和图结构,解决了传统CNN在语义预测中的局限性。文章提出了自信度驱动的策略,自适应遗忘门机制,以及相邻节点的平均隐藏状态,实现在四个挑战数据集上的优秀性能。
摘要由CSDN通过智能技术生成

Motivation

1、使用LSTM网络的动机:传统的CNN大多是捕捉有限的局部信息,但是在语义预测的时候往往需要的是全局的信息。例如“举起的胳膊”这种,对比躯干才能判断胳膊是举起的还是放下的
2、利用graph构建LSTM的动机:利用LSTM进行图像处理的时候通常将图像切成大小固定的patch/pixel,不灵活,不方便

Contribution

1、提出一个基于Graph的LSTM,可以获取上下文的信息,从图片自适应的导出graph
2、提出了一个置信度策略来选取开始节点并且生成更新序列
3、在每个LSTM单元可以动态的学习遗忘门单元
4、在四个challenging的数据集上(PASCAL-Person-Part,Horse-Cow parsing,ATR and Fashionista)上进行实验并且取得了state-of-art的结果

framework

1、输入的RGB图像首先经过预处理,使用SLIC来生成超像素的图像,在此基础上构建graph LSTM
2、随后,原RGB图像经过5层cnn,获得feature map,该feature map分为两路继续进行
3.1 第一路:经过1X1的卷积层,获得confidence map(置信度map)。 注意,这里的confidence map是针对every pixel而言的。 在获得的confidence map上来生成super-pixel级别的confidence map和更新序列,具体做法在下面( Conf

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值