文章目录
1. 赛题介绍
研究现状如下:
- 数据
- 缺少细粒度语义信息
- 缺乏人体运动的特性
- 模型
- 图片相粒度模型
- 细粒度语义识别模型
本次比赛旨在通过建立高精度、细粒度、语义明确的动作识别模型,探索基于骨骼点的时空细粒度人体动作识别创新方法。 人体骨骼点的视频动作识别技术包括了以下三大难点:
- 骨骼点检测误差累计,人体骨骼点检测模型自带误差无法控制,误差会作为噪声累计进入到后面人体动作识别模型中;
- 不同动作类别相似性较高,比较难以区分,如飞利浦跳和勾手跳。
- 数据量小,容易产生过拟合现象。相比图片识别技术,视频识别模型普遍参数量大,训练数据量小(训练集2992个样本) ,由于样本不均衡,容易产生过拟合现象。前30名队伍里,A榜与B榜排名的肯德尔等级相关系数:0.25 (A、B榜排名越相似,相关系数越接近1) ,更说明了大多数队伍模型均出现了不同程度的过拟合现象。
2. 解题思路
针对于难点一:骨骼点检测误差累计。解决思路为:
- 利用随机视频帧采样方式增加对噪声的鲁棒性。
- 增