Heterogeneous Multi-task Learning for Human Pose Estimation with Deep Convolutional Neural Network

最新推荐文章于 2023-06-13 10:53:32 发布

_menglan_Zi

最新推荐文章于 2023-06-13 10:53:32 发布

阅读量2.3k

点赞数

分类专栏： cvpr 文章标签： pose estimation CNN multi-tasks

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zimenglan_sysu/article/details/50294349

版权

该论文介绍了使用深度卷积神经网络进行人体姿态估计的异构多任务学习方法。首先，通过行人检测裁剪图像，然后在裁剪图像上进行姿态估计。网络输入包括裁剪的图像和关节坐标标签，采用归一化处理。训练过程中，同时优化关节回归器和部分检测器的损失函数。测试时仅使用关节回归器预测结果。这种方法通过多任务学习提高性能，但存在通过全连接层直接回归坐标的问题。

摘要由CSDN通过智能技术生成

Heterogeneous Multi-task Learning for Human Pose Estimation with Deep Convolutional Neural Network

论文题目Heterogeneous Multi-task Learning for Human Pose Estimation with Deep Convolutional Neural Network, 链接

该篇论文是IJCV 2014的, 文章的核心multi-tasks的joint traning.

直接看图说话, 该论文的核心思想/步骤可以分为两个components:

1对图像里面的person进行detection, 以便裁剪出图像里面的人.

这个显然是必要的, 尤其是图像大而person小, 或者图像里面的人较多时(>= 2 people)

由于这部分不是该论文里面的重点, 这点在此就不阐述了,

有兴趣的童鞋, 可以自行看一些person detection(或者行人检测)的论文之类的.

2该论文的重头戏, pose estimation in still image. 下面将详细阐述该部分

Pose Estimation:

还是直接看图:

1上图中输入是裁剪好的图像(根据由human body detector得到的bounding box around the human来获取)

2 显然输入除了cropped image还需要对应的labels. 这里的labels就是对应cropped image的joints'/parts'的coordinates.

显然为了获得更好的perfomace, 往往需要对labels进行归一化. 论文里的归一化比较简单:

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

_menglan_Zi CSDN认证博客专家 CSDN认证企业博客

码龄13年

77: 原创

17万+: 周排名

123万+: 总排名

24万+: 访问

: 等级

3284: 积分

149: 粉丝

62: 获赞

146: 评论

117: 收藏

私信

关注

热门文章

分类专栏

最新评论

求两帧图像或着视频的光流（optical flow）
qq_42024848: 这种光流图能否用Matlab来跑，您用的代码能否发给我学习学习，谢谢1315818161@qq.com
Instance-sensitive Fully Convolutional Networks - eccv 2016
我是李武涯: 就是局部相关性,lecun上世纪早就提过了
Instance-sensitive Fully Convolutional Networks - eccv 2016
我是李武涯: 基本理解了,我尝试性解答一下:1.我也不知道 2.本文只用到了二分类,所以没有使用class-specified 3.boudingbox大小决定了感受野,感受野是人为规定的,每个像素都有一个boundingbox 4.直接在groundtruth上用九(k方)宫格形式截取一块下来,其他都是0值
【转载】论文笔记《Object detection via a multi-region & semantic segmentation-aware CNN model》
皮卡丘没有丘: 有没有实验部分的解释呀，实验跑起来好难啊
convolutional pose machines, CVPR 2016
Xiaoxin_05: 想请教一些问题：1）就是原论文中的可接受域要表达什么意思？ 2）进行多尺度的关键点热点图的叠加又在哪里体现，和1）问题有什么关系呢不知道大家是否看过姿态机，我还是抓不住姿态机中为什么每一阶段还要分不同的级别，那是代表尺度？最后是：这个是建立的隐式空间进行表达关节之间的关系，如果要进行显示表达空间关系先验是怎么个情况

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。