本文为原创,转载请注明出处:https://blog.csdn.net/yg970514/article/details/102479700
1. 研究背景及意义
随着计算机技术与网络技术的快速发展,多媒体信息呈爆炸式增长,其中视频作为重要的信息载体,越来越受人们青睐,更多信息通过视频进行传播。然而,对大量视频信息的处理成为一道难题,传统人工检测的方式非常低效和枯燥。随着深度学习技术的崛起,通过计算机自动提取视频中有效信息的方法对视频进行处理,可以大大提高工作效率节省人力资源。而在日常生活中,有一大类视频是关于人类的活动和行为,比如:监控、监护、视频检索。因此,对人体动作的识别逐渐成为目前研究的热门方向。
人体动作识别目的是自动检测出视频中人体姿态类型,以使用视频代替人眼的作用。对象主要针对只包含一个动作且已进行剪辑的视频。而在实际应用中,真实数据往往是一整段未经过处理长视频,同时包含若干连续动作信息。这一任务既包含了视频中动作的识别,也包含了动作在时序上的时间点定位。动作检测是定位视频中所有动作的起始帧和结束帧,并依次识别动作类型。诸如安防场景中,无论道路监控的违章监控,或是商场、学校等公共场景,对于异常行为的检测,显得格外重要。良好的动作检测算法可以大大节省人力物力,同时提高处理效率。
然而,视频动作检测也面临着着巨大考验,比如运动背景问题、图像噪声、物体遮挡问题、光照变化等因素使得视频动作检测难度加大。因此ÿ