Action Recognition

最新推荐文章于 2025-04-15 20:14:22 发布

南有乔木NTU

最新推荐文章于 2025-04-15 20:14:22 发布

阅读量3.8k

点赞数 3

文章标签：行为识别深度学习计算机视觉

本文链接：https://blog.csdn.net/zijin0802034/article/details/72677150

版权

行为识别领域致力于视频分类，任务包括确定视频中的行为类别及其开始和结束时间。常见数据集有UCF101、HMDB51等。近期流行的方法包括两流卷积网络、3D卷积网络等。参考文献涉及深度学习和视频理解的实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Action Recognition

最近关注了行为识别的领域，这个领域主要任务是视频分类，输入一个短视频，经过训练出来的分类器，得到正确的类别。但是一个视频如果存在多个行为，那么这个任务将会变成，输入一个短视频，经过预先训练的分类器，不仅要得到每一个行为的类别，还要得到行为开始时间和结束时间。这样，这个任务的难度提高不少，也更具有挑战性。
为了方便大家进行对比实验，我把目前的方法以及效果粘贴出来，持续更新。

常见的数据集如下：
UCF101: http://crcv.ucf.edu/data/UCF101.php
HMDB51: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/
THUMOS 15:http://www.thumos.info/home.html
Sports-1M:http://cs.stanford.edu/people/karpathy/deepvideo/
YouTube-8M:https://research.google.com/youtube8m/download.html
ActivityNet:http://activity-net.org/download.html
FCVID：http://bigvid.fudan.edu.cn/FCVID/ (特别感谢姜育刚老师对FCVID的贡献)