Object Detection in Video with Spatiotemporal Sampling Networks

最新推荐文章于 2022-06-03 15:32:44 发布

weixin_30952535

最新推荐文章于 2022-06-03 15:32:44 发布

阅读量420

点赞数

原文链接：http://www.cnblogs.com/hf19950918/p/10588696.html

版权

发表在ECCV2018上，提出一种用可变形卷积做特征对齐的方法。

　　与FGFA十分相似，思想都是单帧不够，多帧来凑，利用相邻帧的特征来对当前帧进行增强，以此来达到更好的检测效果。不同点在于FGFA是利用光流来对两张图片的特征进行对齐，

这篇文章采用的是可变形卷积来做特征对齐。

　　首先将当前帧和相邻帧经过一个特征共享的特征提取网络得到各自的feature map，然后把两个feature map在chanel为上拼接，接着做一个可变形卷积，在此过程中得到第一个offset，卷积

的结果作为第二个offset用于和临近帧特征做可变形卷积，卷积结果作为对齐后的特征，之后按照FGFA一样的方式进行加权求和，得到增强后的特征。同FGFA相比，这篇文章利用可变形卷积的方法

对相邻两帧的特征做了隐式对齐，虽然不如光流的方法那么直观，但是效果也还可以。根据文章的实验结果，这种方法精度比FGFA高了0.1。但是没有给出速度的比较，应该比FGFA略快一些，没有用光流网络。

转载于:https://www.cnblogs.com/hf19950918/p/10588696.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_30952535

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

[计算机视觉论文速递] 2018-03-18

阿木寺的博客

03-18

1646

通知：这篇推文有10篇论文速递信息，涉及人脸表情识别、人脸替换、3D人脸重建、Re-ID、目标检测和目标跟踪等方向人脸[1]《Deep Structure Inference Network for Facial Action Unit Recognition》Abstract：面部表情是称为行动单位（AU）的基本组件的组合。识别AU是开发常规面部表情分析的关键。近年来，自动AU识别中的大部分...

VID-视频目标检测

qq_40469867的博客

10-07

1768

视频目标检测 part 1 论文整理有开源的 DFF (2017CVPR): Deep Feature Flow for Video Recognition paper code FGFA (2017ICCV): Flow-guided feature aggregation for video object detection paper code STMN (2018ECCV): Video object detection with an aligned spatial-temporal memor

参与评论您还未登录，请先登录后发表或查看评论

基于视频的目标检测

qq_276982536的博客

11-10

370

2017 Flow-Guided Feature Aggregation for Video Object Detection 这个论文中说，他之前的论文，用cnn提取出特征后，利用相邻帧的特征来补充当前帧的特征。而他采用了利用网络来做这个事情，提出一个网络，训练这个网络来合并、补充特征，再将完善后的特征图用来目标检测。 2018Object Detection in Video with Spatiotemporal Sampling Networks 这个论文中基于前面那个，提出利用deformabl

Spatio-Temporal Object Detection Proposals翻译

qq_28871609的博客

07-15

339

摘要：视频中的动作和事件的时空检测是一个具有挑战性的问题。除了与识别相关的困难之外，视频中检测的主要挑战是由沿着帧的边界框序列形成的时空管定义的搜索空间的大小。最近，已经证明产生无监督检测提议的方法对于静止图像中的对象检测非常有效。这些方法开启了使用强但计算上昂贵的特征的可能性，因为仅需要评估相对少量的检测假设。在本文中，我们为利用时空检测问题的检测方案做出了两点贡献。首先，我们扩展最近的2D对象...

Temporal Context Enhanced Feature Aggregation for Video Object Detection

breeze_blows的博客

06-26

2140

论文链接：https://www.aaai.org/Papers/AAAI/2020GB/AAAI-HeF.1752.pdfAAAI2020的一篇文章

视频目标检测综述

逆熵而行

03-08

8792

视频目标检测，相对于图片目标检测，最大的特点就是增加了上下文的信息，视频的每一帧图片有上下文的连接对应关系和相似性。由于有上下文的关系，所以可以利用前后帧的检测结果，提升当前帧的检测精度；由于前后帧具有相似连续性，所以可以利用冗余信息加快每一帧的检测速度。目前大部分的论文都把视频帧分成关键帧和非关键帧两部分，关键帧的选取有两种方法：一种是间隔固定的帧数选取，另一种是自适应的方法选取。关键帧上的目...

基于视觉的机器人抓取: 论文及代码(Vision-based Robotic Grasping: Papers and Codes)

dsoftware的博客

10-22

2万+

Compressed video Quality Enhancement

C_P_J_M的博客

06-03

372

论文索引图

【视频理解论文】——SlowFast Networks for Video Recognition

Amazingren的博客

09-16

1492

SlowFast Networks for Video Recognition(ICCV2019) 【摘要Abstract】所提出的SlowFast模型由两部分构成（1）Slow pathway：以低帧率获取Spatial信息；（2）Fast pathway：以高帧率运行，以获取motion，也就是时序信息还强调了Fast pathway通过减少了通道的数量/容量，因此是以非常轻量级...

显著性检测——LC模型

hit1524468的专栏

03-22

3844

1. 参考文献： Visual Attention Detection in Video Sequences Using Spatiotemporal Cues。 Yun Zhai and Mubarak Shah. Page 4-52. 模型实现2.1 显著性检测公共头文件#ifndef SALIENTCOMMON_H #define SALIENTCOMMON_H // std lib #i...

显著性检测Context-Aware Saliency Detection自己编写的matlab代码

04-12

显著性检测经典论文：Context-Aware Saliency Detection 自己编写的matlab代码实现，包扩所有函数

Object Detection(目标检测神文)

热门推荐

Mars_WH的专栏

08-21

6万+

目标检测神文，非常全而且持续在更新。转发自：https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html，如有侵权联系删除。 Papers ———————————————————————————————————- Deep Neural Networks for Object Detection Ov...

ECCV-2018-Video Object Detection with an Aligned Spatial-Temporal Memory-论文阅读笔记

Meihuashan_HUST的博客

11-28

2146

摘要：本文针对视频目标检测问题提出时空记忆网络。他的核心是时空记忆模块，作为一种递归计算单元去建模长时间目标外观和运动信息。STMM的设计使得可以用一个预训练的CNN主体结构初始化，这对提高检测精度非常重要。本文为了建模目标运动提出匹配变换去对齐视频中目标的运动。本文的方法在VID数据集上获得了state-of-art的结果，我们的受控实验证明了本文设计架构的有效性，代码和模型都公开在 http...

ECCV2018 paper list

Charlotte_DL的博客

09-05

2994

作者：胡孟链接：https://zhuanlan.zhihu.com/p/43715653 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。感谢cvfoundation，提供了这么优质的论文索引，之前CVPR、ICCV已经收录在cvfoundation中，历年论文也很方便检索，从今年开始ECCV也正式收录到了cvfoundation中，真是大家的福音（当然...

双流网络行为识别-Spatiotemporal Residual Networks for Video Action Recognition-论文阅读

Camaro的专栏

03-02

1万+

前几天刚放出来的一篇paper：Spatiotemporal Residual Networks for Video Action Recognition，又将HMDB51数据库和UCF101数据库的精度刷高了。精度结果如下：这比之前的tsn网络的结果还要好，之前tsn的结果是：Temporal Segment Networks: Towards Good Practices for

视频目标检测(video object detection)简单综述

breeze_blows的博客

04-13

2万+

1.Memory 2.Attention RDN: ICCV2019 Relation Distillation Networks for Video Object Detection[paper]. faster rcnn为backbone，用multi-stage的形式将support frame的proposal来逐步增强reference frames的proposal特征，...

四种简单的图像显著性区域特征提取方法-----> AC/HC/LC/FT。

weixin_30569153的博客

02-15

4335

四种简单的图像显著性区域特征提取方法-----> AC/HC/LC/FT。分类：图像处理 2014-08-03 12:40 4088人阅读评论(4) 收藏举报 salient region detec显著性检测 laviewpbt 2014.8.3 编辑 Email：laviewpbt@sina.com QQ：33184777 最近闲来蛋痛，看了一些显著性检测的文章...

显著性论文学习阶段总结（一）

weixin_34417183的博客

03-22

577

1.Mingming Cheng,Global Contrast based Salient Region Detection,CVPR2011 1) HC：基于直方图对比度的方法，每一个像素的显著性值是由它与图像中所有其他像素的颜色差异来确定，得到全分辨率显著性图像； 2) RC：基于局部对比度的方法，先将图像分割成小区域，采用的分割方法是基于图的分割，基本分割思想是将每个像素点作为无向...

Object Detection(目标检测神文)---3

03-23

2万+

Object Detection on Mobile Devices Pelee: A Real-Time Object Detection System on Mobile Devices intro: ICLR 2018 workshop track intro: based on the SSD arxiv: https://arxiv.org/abs/1804.06882 ...

Graph Convolutional Adversarial Networks for Spatiotemporal Anomaly Detection