Pose for Action – Action for Pose论文阅读

最新推荐文章于 2025-05-08 17:42:45 发布

error:404..

最新推荐文章于 2025-05-08 17:42:45 发布

阅读量299

点赞数

分类专栏：姿态估计文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41845951/article/details/126839800

版权

姿态估计专栏收录该内容

15 篇文章

订阅专栏

摘要

建模特定于动作的外观模型和姿态先验合并成高级特征用于姿态估计和动作识别

即用 动作语义信息（action label）+姿态特征 做多任务，证明姿态和动作两任务互利。

引言

1.问题：图像结构模型（PS）很难应对人类姿态和外貌的巨大变化

2.思路：动作类别信息有利于姿态估计

3.创新点：提出了动作条件图像结构（ACPS）模型，即依赖于动作类的先验分布，该模型融合了动作先验知识，并且学习动作类之间的共享信息。

4.方法概述：随机森林 + 条件随机场 + 动作先验

方法

4. Pictorial Structure

主要是利用了两层随机森林，第一层用于做姿态估计定位，第二层用于父节点约束子节点进行优化定位。

其中j为关节点下标，代表的2D坐标，I为图片，为一元Potentials，即结构图中1所示的随机森林，用于对关节点j定位，为二元Potentials，即结构图中2所示的随机森林，用于父节点p约束子节点j。

4.1 一元Potentials

结构图中1所示，一元Potentials = VGG16 + 回归森林

VGG16结构如下，值得注意的是特征是进行上采样后融合的

回归森林F由一组随机回归树T组成，每个节点代表一个弱分类器，将image patch P传递到左右子节点

训练时，每棵树都用训练集进行抽样学习，将关节点位置标注周围像素作为前景，其他作为背景，每个patch包含联合标签c ∈ {0, j}，一组图像特征，和2D偏移量，叶子节点预测类概率和偏移量的分布概率

测试时，以位置y为中心的每个patch在叶子节点结束，其中每棵树

表示P(叶子节点预测的节点为j) * P(偏移量的分布概率)，即为关节点j的分布预测

4.2 二元Potentials

如结构图2所示，表示父节点P约束子节点j，约束方法同样是训练集统计p与j的相对位置，通过k-means聚类，每个类用加权高斯分布来表示：

其中，为均值，为协方差，，根据聚类频率来计算的，

最后通过最大边缘值来为每个关节点选择最佳簇k。

5. Action Conditioned Pose Estimation

将distribution P(a)引入Pictorial Structure中

5.1. Action Conditioned Pictorial Structure

代表结构图中3所示，也即是不同动作下

本文还将P（a）简化：

5.1.1 Conditional Joint Regressors

用动作标签来增强学习，动作类a上的分布：

5.1.2 Appearance Sharing Across Actions

本文作者认为不同动作之间也是有相似特征的，动作a与动作a'应该有个相似权重，

如何学习共享权重：

即算动作标签为a的图片与真实值的误差，再经过argmax，

最后用平滑操作，得到最后预测结果：

6.实验

1.VGG那块的特征消融

2.模型组合消融

3.sub-J-HMDB大表

4.Penn Action dataset大表

5.动作识别

博客等级

码龄7年

40
原创

74
点赞

544
收藏

36
粉丝

关注

私信

热门文章

分类专栏

最新评论

HigherHRnet详解之实验复现
流星芭比锤: 你好大佬，为什么我用HigherHRNet预训练模型跑出来的结果很差，有关节点乱连，还有一个人重复检测很多次的问题啊
TSN实验过程
_养乐多_: [code=python] (base) PS D:\AIAlgorithm\IntelligentDetectionVehicle\mmaction> python data_tools/build_file_list.py ucf101 ../data/rawframes/ --level 2 --format rawframes --sh Traceback (most recent call last): File "D:\AIAlgorithm\IntelligentDetectionVehicle\mmaction\data_tools\build_file_list.py", line 4, in <module> from mmaction.datasets.utils import (parse_directory, ModuleNotFoundError: No module named 'mmaction.datasets.utils' [/code]请问有没有知道这个错误怎么解决？
使用ResNet18处理cifar10数据集
charlie_jiuxing: 求问博主，如何进行中间层的特征提取呀
Supervised Contrastive Learning浅读
zt_20110902: 您好，可以加下微信吗？有不懂的地方想问下
Supervised Contrastive Learning浅读
zt_20110902: 那个损失函数中的上标为什么是2N？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。