人体姿态估计&动作识别调研报告

最新推荐文章于 2023-07-17 11:08:59 发布

A_Z666666

最新推荐文章于 2023-07-17 11:08:59 发布

阅读量602

点赞数 1

文章标签：人体行为检测人体关键点检测深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A_Z666666/article/details/131750683

版权

人体姿态估计&动作识别

视频演示

Refs: https://www.zhihu.com/zvideo/1227562268420235264

姿态估计与行为识别（行为检测、行为分类）的区别

Refs：姿态估计与行为识别（行为检测、行为分类）的区别

姿态估计

定位图片和视频中的人体关节，重建人的关节和肢干。
四个方向：
1. 单人姿态估计（Single-Person Skeleton Estimation）：先定位人体，再根据行人区域，找出关键点。
2. 多人姿态估计（Multi-Person Pose Estimation）：两种方式：
  1. Top-down：先定位到图片中的所有人体，在找出关键点。
  2. bottom-up：先找出关键点，再组装成行人。
3. 人体姿态跟踪（Video Pose Tracking）：
  1. 人体关键点在视频中的temporal motion会比较大，比如一个行走的行人，手跟脚会不停的摆动，所以跟踪难度会比跟踪人体框大。
  2. 数据集：PoseTrack
4. 3D人体姿态估计（3D skeleton Estimation）： ^764e2c
  1. VS 2D：
    1. 2D姿势估计：从RGB图像估计每个关节的2D姿势（x，y）坐标。
    2. 3D姿势估计：从RGB图像估计3D姿势（x，y，z）坐标。
    3. 即使基于轻量主干网络（MobileNetV2）所预测的2D姿态用于动作识别时，效果也好于任何来源的3D人体姿态估计。Ref
  2. 数据集：Human3.6M

行为识别(Action Detection/Regnition)

概述

图像或视频中目标的行为类别。
两个方向：
1. 行为分类（Action Recognition)
  1. 定义：一般使用的数据集会将动作分割好，一个视频片段包含一段明确的动作。
  2. 特点：时间短且有唯一确定标签。所以input为视频，输出为label。类似Image Classification。
  3. 数据集：
    1. https://zhuanlan.zhihu.com/p/86461157 （都是剪切好的视频，不符合行为检测的要求）
2. 行为检测（Temporal Action Localizationÿ

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
人体姿态估计&动作识别调研报告

图像或视频中目标的行为类别。两个方向：行为分类（Action Recognition)定义：一般使用的数据集会将动作分割好，一个视频片段包含一段明确的动作。特点：时间短且有唯一确定标签。所以input为视频，输出为label。类似Image Classification。数据集：https://zhuanlan.zhihu.com/p/86461157 （都是剪切好的视频，不符合行为检测的要求）行为检测（Temporal Action Localization）
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。