一文了解通用行为识别ActionRecognition:了解及分类

本文介绍了行为识别的概念,如Hand gesture、Action、Activity和Classification、Detection的区别,并概述了UCF-101、HMDB-51等数据集。讨论了传统模型与基于深度学习的模型,如TwoStream、C3D、LSTM等,并预告了未来将深入探讨的算法,包括Skeleton-based、Two-Stream、3D Conv和LSTM行为识别。
摘要由CSDN通过智能技术生成

参考:https://zhuanlan.zhihu.com/p/103566134
参考博客:https://blog.csdn.net/qq_31470761/article/details/104655762?utm_medium=distribute.pc_aggpage_search_result.none-task-blog-2allfirst_rank_v2~rank_v25-1-104655762.nonecase&utm_term=eco%E8%A1%8C%E4%B8%BA%E8%AF%86%E5%88%AB%E9%A2%84%E6%B5%8B
https://blog.csdn.net/SIGAI_CSDN/article/details/82828114
在这里插入图片描述

本文目录:
一.行为识别背景

二.行为识别总结

三.接下来的安排

四.一些心得总结

一.背景

行为识别Action Recognition是指对视频中人的行为动作进行识别,即读懂视频。根据要处理的动作类别和真正要处理的任务不同,在各种情况下所说的行为识别的任务略有差异,首先对两组概念进行对比和区分:

1.Hand gesture, Action, Activity

Hand gesture:集中于处理视频片段中单人的手势

Action:短时间的行为动作,场景往往是短视频片段的单人行为,比如Throw,catch,clap等

Activity:持续时间较长的行为,场景往往是较长视频中的单人或多人行为,例如Reading a book,making a phone call, eating, talking to each other, hugging,palying basketball等

这里提一句,Action和Activity的主要区别在于Action是指动作,Activity是指行为,可以认为Action的粒度更细,而Activity的粒度更粗,也可以说Action是Activity的子集。但其实在实际的算法中,有时候也没必要将二者完全区分开。

2.Classification,Detection

Classification:给定预先裁剪好的视频片段,预测其所属的行为类别

Detection:视频是未经过裁剪的,需要先进行人的检测where和行为定位(分析行为的始末时间)when,再进行行为的分类what。

我们这里所涉及到的行为识别Action Recignition可能是Hand gesture/Action/Activity和Class

  • 3
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值