GOTURN——Learning to Track at 100 FPS with Deep Regression Networks


文章的题目叫:《Learning to Track at 100 FPS with Deep Regression Networks》
算法简称:GOTURN(Generic Object Tracking Using Regression Networks)
作者是斯坦福的David Held
文章以及附件: http://davheld.github.io/GOTURN/GOTURN.html
算法源码: https://github.com/autocyz/GOTURN

1、算法速度

当我第一眼看到文章题目时,真的被吓一跳,用深度网络做跟踪能达到100FPS?
are you kiding?
再一看, 哦,原来是在GPU上跑的。
But,即使是GPU这也还是很快啊,别的用深度网络做跟踪的能达到10FPS就very well了!

在看文章内容之前,咱们先看看这个算法的速度到底是怎样的。引用作者中的内容:

On an Nvidia GeForce GTX Titan X GPU with cuDNN acceleration, our tracker runs at 6.05 ms per frame (not including the 1 ms to load each image in OpenCV), or 165 fps. On a GTX 680 GPU, our tracker runs at an average of 9.98 ms per frame, or 100 fps. If only a CPU is available, the tracker runs at 2.7 fps.

好一点的GPU,能达到165fps;稍微逊色一点的GPU,能达到100fps;不用GPU呢,2.7fps(对于用CNN做跟踪的,的确是很不错的速度了,鄙人看过一个CNN做跟踪的算法用好的GPU,也才7fps)

  最近亲自跑了一下,发现速度确实可喜!!!

2、算法整体框架:



图1 算法整体框架1

整个算法实现的框架如上图:作者将上一帧的目标和当前帧的搜索区域同时经过CNN的卷积层(Conv Layers),然后将卷积层的输出通过全连接层(Fully-Connected Layers),用于回归(regression)当前帧目标的位置。整个框架可以分为两个部分:
- 1、卷积层,用于提取目标区域和搜索区域的特征
- 2、全连接层,被当成一个回归算法,用于比较目标特征和搜索区域特征,输出新的目标位置

作者对网络的训练是offline的,在跟踪的时候没有online update的过程。这也是算法速度足够快的一个重要原因,把耗时的计算过程都离线做好,跟踪过程只有一个计算前馈网络的过程,



图2 算法整体框架2

3、算法实现细节

3.1、算法输入输出形式

输入:
在第t-1帧中,假设目标所在位置为(cx,cy),其大小为(w,h),则提取一块大小为(2w,2h)的图像块输入到CNN中。
在第t帧中,也以(cx,cy)为中心,提取大小为(2w,2h)的图像块,输入到CNN中。

输出:
输出目标在第t帧中左上角和右下角的坐标。

3.2、网络结构

见图1。
网络的卷积层采用的是CaffeNet的前五层(caffenet:
https://github.com/BVLC/caffe/tree/master/models/bvlc_reference_caffenet)。
并在imagenet上进行了预训练。

后面是3层全连接层,每层都有4096个结点,全连接层之后是一个只有四个结点的输出层,用于输出目标左上、右下的坐标。

3.3、网络的训练过程

这篇文章的训练方法比较有意思,在看他如何训练前,先看作者的一些关于跟踪视频序列性质的研究:

对于跟踪问题,一般的当前帧目标的位置和尺度都与上一帧是有关系,这个关系到底是怎么样的暂时没人分析过,作者通过对视频序列中的groundtruth进行研究发现,当前帧目标的位置和尺度变化与上一帧的目标存在着某种分布关系,具体分析如下:

cx=cx+wΔxcy=cy+hΔyw=w
  • 14
    点赞
  • 43
    收藏
    觉得还不错? 一键收藏
  • 16
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值