Cascaded Human-Object Interaction Recognition论文阅读笔记

最新推荐文章于 2022-06-21 15:43:11 发布

xingaoli

最新推荐文章于 2022-06-21 15:43:11 发布

阅读量802

点赞数 1

分类专栏： HOI 文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46805191/article/details/115727488

版权

笔记

现有的方法大都采用single-stage的推理线，考虑到任务的复杂性，作者提出了一种采用级联结构，多分支，从粗糙到细致的HOI理解。
如图1，作者的模型包含了一个实例定位网络和一个交互识别网络。这两个网络都以级联的形式工作，通过实例定位网络，一步一步的增强选择的实例，proposal的质量提高，对于接下来的相关表示也是非常有用的。而且也可以实现更好的动作预测。
如图2可以看出两种模式的区别，a表示的是single stage方法，b是作者提出的级联结构，这种结构不仅可以解决HOI检测的问题，还可以用于图像分割。
图3a是整个网络的pipeline，输入一个图片，首先通过backbone提取特征，然后通过L定位proposal，然后配对采样，再通过R识别动词。图b是R中的RCM模块。
首先是L部分，即Instance Localization Network:这部分的输出是一个人物区域的集合，有许多标定的人物框和物体框，这些框经过采样再送入下一个模块R进行verb classific

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。