此号不在服务区-CSDN博客

原创 2021-03-30

Late Temporal Modeling in 3D CNN Architectures with BERT for Action Recognition 1。概述：在3DCNN的基础上进行的改进，把3DCNN最后的全局平均池化层换成了 Bidirectional Encoder Representations from Transformers(BERT)，为了更好的利用时间信息。 2.主要结构 ...

2021-03-31 21:48:50 238

原创 2020-12-18

cv2017 Action Tubelet Detector for Spatio-Temporal Action Localization 这篇文章以一系列的帧代替单针进行检测，设计出了 action tubelet detector(ACT-detector).这个ACT-detector是基于锚型长方体建立的，建立在SSD网络框架之上。 1.introduction 以前的action 定位都在帧水平上，然后根据他们的帧与帧之间的连接或者随时间跟踪来建立action tubes。以前的方法是吧视频看做

2020-12-22 15:54:42 154 1

原创 2020-11-26

cvpr2015 finding action tubes 学习总结 1.introduction 现在的物体识别有2个问题，其一是图像的分类，二为物体的检测。传统的视频检测还停留在以一个视频为整体进行分类，比如说视频中有椅子吗，但是这篇文章建立了action tubes以进行视频中的行为检测。以motion（运动）的线索分辨出哪块区域有行为，哪块没有。这个大大的减少了加工区域和电脑的运算速率。建立一个模型用于实时连贯的检测。这种检测叫action tubes。检测通道有两条，一条检测物体的颜色、形状

2020-12-01 11:41:09 141

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人