算法-深度学习-目标检测
华山汉灵
计算机视觉算法工程师
展开
-
ICCV-2017-08-msra-Flow-Guided Feature Aggregation for Video Object Detection-论文阅读笔记
原文:https://arxiv.org/abs/1703.10025代码:https://github.com/msracver/Flow-Guided-Feature-Aggregation摘要:现存的性能最好的图像目标检测算法直接应用到视频上,仍有一些困难。性能退化的原因有运动模糊、相机散焦、不太常见的外观等。现有的工作一般是在检测结果输出后再应用帧间信息,这种做法的一个缺点是不能做到...原创 2018-11-24 16:00:16 · 371 阅读 · 0 评论 -
ECCV-2018-Video Object Detection with an Aligned Spatial-Temporal Memory-论文阅读笔记
摘要:本文针对视频目标检测问题提出时空记忆网络。他的核心是时空记忆模块,作为一种递归计算单元去建模长时间目标外观和运动信息。STMM的设计使得可以用一个预训练的CNN主体结构初始化,这对提高检测精度非常重要。本文为了建模目标运动提出匹配变换去对齐视频中目标的运动。本文的方法在VID数据集上获得了state-of-art的结果,我们的受控实验证明了本文设计架构的有效性,代码和模型都公开在http...原创 2018-11-28 22:49:06 · 2056 阅读 · 2 评论 -
CVPR(spotlight)-2017-11-msra-Towards High Performance Video Object Detection-论文阅读笔记
摘要:图像目标检测已经取得了巨大的进步,但是视频目标检测关注度要低一些,其实他挑战性和实用性更高一些。基于之前的Deep Feature Flow和Flow-guided Feature Aggregation for Video Object Detection,本文在三个方面进行了改进,提高了模型的精度和速度。引言将图像目标检测直接应用到视频上,除了上一篇博文提到的问题还有视频中临近帧...原创 2018-11-25 20:16:52 · 329 阅读 · 0 评论 -
2018-04-Towards High Performance Video Object Detection for Mobiles-论文阅读笔记
原文:https://arxiv.org/abs/1804.05830摘要:轻量的图像目标检测网络应用到关键帧上。轻量的光流网络建立帧间关系。光流导向的GRU模块被用于关键帧特征的集成。对于非关键帧用光流进行特征图传播。整个网络端到端训练,在VID达到60.2的mAP,跑到25帧的速度(HuaWei Mate 8 )引言:虽然一些工作针对轻量型的网络,比如SqueezeNet,Mobil...原创 2018-11-27 19:52:22 · 1280 阅读 · 0 评论 -
ICCV(spotlight)-2017-10-Detect to Track and Track to Detect
原文:https://arxiv.org/pdf/1710.03958.pdf代码:http://github.com/feichtenhofer/detect-track摘要:本文主要做出了三个贡献,1)提出全卷积网络,借助多任务的单帧检测和帧间回归跟踪同时处理检测和跟踪问题,2)提出表征帧间目标相关性的相关特征帮助跟踪,3)将帧间的轨迹片段关联起来得到高精度的检测结果。最终方法在VID数...原创 2018-12-09 17:44:49 · 1485 阅读 · 2 评论 -
AAAI(spotlight)-2018-12-Detect or Track-论文阅读笔记
摘要:当前最好的检测器和跟踪器正在往越来越快方向发展。跟踪的计算量一般小于检测,但是有漂移的问题。利用现有的检测/跟踪器在给定的计算条件下来提高精度。最常用的做法是隔N帧进行一次检测,检测之间做跟踪,但是检测的频率取决于跟踪的精度。本文提出一个调度网络,确定当前帧做检测还是做跟踪,虽然调度网络比较轻量,但是比隔真检测更有效。一. 引言:跟踪器在效率和精度上一般比检测器要高一些,但是存在不能长...原创 2019-01-10 21:58:29 · 853 阅读 · 0 评论 -
2017-06-Deep Network Flow for Multi-Object Tracking-论文阅读笔记
摘要:数据关联是很多计算机视觉应用的重要组成部分,多目标跟踪就是其中的一个例子。典型的数据跟踪方法是找到一个图匹配方式或者一个网络流使得配对连接的代价最小,然而经常使用的是手工设计特征或者固定特征的线性函数。本文指出通过将优化问题表示为可微的函数反向传播学习数据关联的特征是必要。本文用上述思路解决多目标跟踪问题,所有的代价函数均可学习统一到一个end-to-end的框架中,达到比手工设定更好的水...原创 2019-01-02 11:49:15 · 830 阅读 · 0 评论 -
点云目标检测-综述2019.04
说明:美团无人配送团队主笔,摘录自智车科技公众号激光雷达成像原理通常采集到的360°的数据被称为一帧,上面的例子中一帧数据在理论上最多包含32*(360/0.2)=57600个点,在实际情况中如果雷达被放置在车的上方大约距地面1.9米的位置,则在比较空旷的场景中大约获得40000个点,一部分激光点因为被发射向天空或被吸收等并没有返回到接收器,也就无法得到对应的点。下图是典型的一帧数据的可视化...转载 2019-04-27 20:32:59 · 17569 阅读 · 2 评论 -
旷视-2019.03-ThunderNet
摘要:轻量的两阶段检测器。分析了之前Backbone的缺点,设计了新的Backbone;研究了更高效的Detection head;为了得到区分度更高的特征,提出了两个模块,Context Enhance Module和Spatial Attention Module;最后研究了输入大小、backbone和head的平衡。最终得到了和SSD300相近的结果,在ARM平台上跑到24.1fps的速...原创 2019-04-28 16:01:27 · 808 阅读 · 0 评论