本文的创新:
1.提出了一个残差网络与inception-v3结合的思路;
2.将2D膨胀成3D用于处理视频序列;
3.首先使用3D卷积学习UCF-101的特征,再使用迁移学习的办法在WWW数据集上进行微调,使用一个熵函数计算多标签概率
4.使用了两个branch进行训练,第一个branch使用光流特征进入,第二个使用运动特征,然后在高层进行融合(和上一篇文章相似)
学到的东西:
1.进行人群行为分析的办法主要有四种:1.光流法;2.轨迹;3.HOG特征;4.社会学方法,[14]提到了关于运动模式分割的一个思路;
2.通过UCF-101到WWW迁移学习的处理办法;
3.进行人群行为分析对视频的处理办法,这里使用了25帧作为一个视频序列;
4.对行为分析精度指标的界定:AUC和mAP;
《3D Res-Inception Network Transfer Learning for Multiple Label Crowd Behavior Recognition》解读
最新推荐文章于 2023-05-14 20:53:52 发布