人体姿态估计&动作识别调研报告

人体姿态估计&动作识别

视频演示

Refs: https://www.zhihu.com/zvideo/1227562268420235264

姿态估计与行为识别(行为检测、行为分类)的区别

Refs:姿态估计与行为识别(行为检测、行为分类)的区别

姿态估计

  1. 定位图片和视频中的人体关节,重建人的关节和肢干。
  2. 四个方向:
    1. 单人姿态估计(Single-Person Skeleton Estimation):先定位人体,再根据行人区域,找出关键点。
    2. 多人姿态估计(Multi-Person Pose Estimation):两种方式:
      1. Top-down: 先定位到图片中的所有人体,在找出关键点。
      2. bottom-up:先找出关键点,再组装成行人。
    3. 人体姿态跟踪(Video Pose Tracking):
      1. 人体关键点在视频中的temporal motion会比较大,比如一个行走的行人,手跟脚会不停的摆动,所以跟踪难度会比跟踪人体框大。
      2. 数据集:PoseTrack
    4. 3D人体姿态估计(3D skeleton Estimation): ^764e2c
      1. VS 2D:
        1. 2D姿势估计:从RGB图像估计每个关节的2D姿势(x,y)坐标。
        2. 3D姿势估计:从RGB图像估计3D姿势(x,y,z)坐标。
        3. 即使基于轻量主干网络(MobileNetV2)所预测的2D姿态用于动作识别时,效果也好于任何来源的3D人体姿态估计。Ref
      2. 数据集:Human3.6M

行为识别(Action Detection/Regnition)

概述
  1. 图像或视频中目标的行为类别。
  2. 两个方向:
    1. 行为分类(Action Recognition)
      1. 定义:一般使用的数据集会将动作分割好,一个视频片段包含一段明确的动作。
      2. 特点:时间短且有唯一确定标签。所以input为视频,输出为label。类似Image Classification。
      3. 数据集:
        1. https://zhuanlan.zhihu.com/p/86461157 (都是剪切好的视频,不符合行为检测的要求)
    2. 行为检测(Temporal Action Localizationÿ
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值