论文阅读:Learning Human-Object Interactions by Graph Parsing Neural Networks

GPNN(ECCV2018)

文章
  用来检测human-object interaction。Paper说提出GPNN的目的是为了在HOI任务中显式地对空间、时间(视频)以及human-object关系进行利用。
这里写图片描述
  complete HOI指的是所有的node之间都有link,node包括human和object,假设node特征为d_V维,edge的特征为d_E维(从两个box的union box提取得到的),且complete HOI一共有N个node,那么特征矩阵F则为NxNx(2d_V+d_E),也就是每两个node及其之间的边都要按顺序组合一次。然后用1x1的卷积计算出一个邻接矩阵。邻接矩阵可以用来表示两个node的某种相关性

这里写图片描述

  上面的公式为每个node的状态h的更新过程,A是邻接矩阵,M是计算message的函数,U是利用当前状态h和新的信息m计算更新状态h的函数。然后这样不断地迭代:

计算特征矩阵F –> 计算邻接矩阵A –> 计算message –> 更新node隐藏状态 –> 计算特征矩阵F…

  迭代一定次数后,graph收敛?得到每个node的一个综合了context的隐藏状态,然后使用一个readout函数,得到每个node的输出:

这里写图片描述

关于具体的网络结构:


这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述

  关于每对HOI的分数,则是由对应的human和object的readout的score相乘得到的。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值