论文阅读：Learning Human-Object Interactions by Graph Parsing Neural Networks

最新推荐文章于 2022-04-20 16:08:25 发布

Kivee123

最新推荐文章于 2022-04-20 16:08:25 发布

阅读量3.1k

点赞数

文章标签： scene understand

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37014750/article/details/82683142

版权

GPNN(ECCV2018)

文章
用来检测human-object interaction。Paper说提出GPNN的目的是为了在HOI任务中显式地对空间、时间（视频）以及human-object关系进行利用。
这里写图片描述
complete HOI指的是所有的node之间都有link，node包括human和object，假设node特征为d_V维，edge的特征为d_E维（从两个box的union box提取得到的），且complete HOI一共有N个node，那么特征矩阵F则为NxNx(2d_V+d_E)，也就是每两个node及其之间的边都要按顺序组合一次。然后用1x1的卷积计算出一个邻接矩阵。邻接矩阵可以用来表示两个node的某种相关性

这里写图片描述

上面的公式为每个node的状态h的更新过程，A是邻接矩阵，M是计算message的函数，U是利用当前状态h和新的信息m计算更新状态h的函数。然后这样不断地迭代：

计算特征矩阵F –> 计算邻接矩阵A –> 计算message –> 更新node隐藏状态 –> 计算特征矩阵F…

迭代一定次数后，graph收敛？得到每个node的一个综合了context的隐藏状态，然后使用一个readout函数，得到每个node的输出：

这里写图片描述

关于具体的网络结构：

这里写图片描述

这里写图片描述

这里写图片描述

这里写图片描述

关于每对HOI的分数，则是由对应的human和object的readout的score相乘得到的。

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：Learning Human-Object Interactions by Graph Parsing Neural Networks

GPNN(ECCV2018)文章用来检测human-object interaction。Paper说提出GPNN的目的是为了在HOI任务中显式地对空间、时间（视频）以及human-object关系进行利用。 complete HOI指的是所有的node之间都有link，node包括human和object，假设node特征为d_V维，edge的特征为d_E维（从两个box...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。