论文笔记：PaStaNet Toward Human Activity Knowledge Engine(CVPR2020)

江东陆伯言

已于 2022-04-27 15:53:02 修改

阅读量384

点赞数 1

分类专栏： Visual Relationship 文章标签：深度学习计算机视觉人工智能机器学习

于 2021-05-11 14:00:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43731803/article/details/116651710

版权

核心思路：直接从图像推理activity会有鸿沟，因此首先推理human part states（即PaSta，形式如<hand,hold,something>），再用part-level的语义去推理动作。首先用一个叫Activity2Vec的模型去提取PaSta特征，再用一个基于PaSta的方法去推理activity。
以往的工作主要利用部件的外观和位置，但很少有研究试图将实例动作划分为离散的part-level语义标记，并将其作为活动概念的基本组件。相比之下，我们的目标是将人体part语义构建为可重用和可转移的知识。

一、构建PaStaNet
1.PaSta定义：将human body分为10个part，头、两条上臂、双手、臀部、两条大腿、双脚。
2.共包括156种activity
3.做实验验证了PaSta覆盖了大部分的activity，且具有learned和transferred的属性。

二、PaStaNet表示activity
1.流程
在这里插入图片描述

其中I是输入图像，Bp是10个part的box，bo是与人交互的object的box；
fo是object的特征，如果没有交互的object，就用整张图像的ROI pooling特征作为fo，如果有多个object，则分别处理每个human-object对

最低0.47元/天解锁文章

江东陆伯言

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文笔记：PaStaNet Toward Human Activity Knowledge Engine(CVPR2020)

核心思路：直接从图像推理activity会有鸿沟，因此首先推理human part states（即PaSta，形式如<hand,hold,something>），再用part-level的语义去推理动作。首先用一个叫Activity2Vec的模型去提取PaSta特征，再用一个基于PaSta的方法去推理activity。以往的工作主要利用部件的外观和位置，但很少有研究试图将实例动作划分为离散的part-level语义标记，并将其作为活动概念的基本组件。相比之下，我们的目标是将人体part语义构
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。