- 博客(3)
- 收藏
- 关注
原创 2021-03-30
Late Temporal Modeling in 3D CNN Architectures with BERT for Action Recognition 1。概述: 在3DCNN的基础上进行的改进,把3DCNN最后的全局平均池化层换成了 Bidirectional Encoder Representations from Transformers(BERT),为了更好的利用时间信息。 2.主要结构 ...
2021-03-31 21:48:50
238
原创 2020-12-18
cv2017 Action Tubelet Detector for Spatio-Temporal Action Localization 这篇文章以一系列的帧代替单针进行检测,设计出了 action tubelet detector(ACT-detector).这个ACT-detector是基于锚型长方体建立的,建立在SSD网络框架之上。 1.introduction 以前的action 定位都在帧水平上,然后根据他们的帧与帧之间的连接或者随时间跟踪来建立action tubes。以前的方法是吧视频看做
2020-12-22 15:54:42
154
1
原创 2020-11-26
cvpr2015 finding action tubes 学习总结 1.introduction 现在的物体识别有2个问题,其一是图像的分类,二为物体的检测。传统的视频检测还停留在以一个视频为整体进行分类,比如说视频中有椅子吗,但是这篇文章建立了action tubes以进行视频中的行为检测。 以motion(运动)的线索分辨出哪块区域有行为,哪块没有。这个大大的减少了加工区域和电脑的运算速率。建立一个模型用于实时连贯的检测。这种检测叫action tubes。 检测通道有两条,一条检测物体的颜色、形状
2020-12-01 11:41:09
141
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人