GOTURN

GOTURN


  • -Model(pytorch版本

《Learning to Track at 100 FPS with Deep Regression Networks》
—基于GOTURN的目标跟踪
作者:David Held
单位:斯坦福大学
发表会议及时间:ECCV 2015

一 论文导读

跟踪算法背景:

  • 静态场
    背景是静态的
  • 动态场
    背景是动态的

GOTURN是运用在动态场的深度学习算法

为什么传统深度学习算法跟踪算法的实时性能都不好?
—基本在5fps左右

  1. 因为采用了online training for tracking 的方式,计算量大,并且没有从大量视频数据中得到离线训练的优势
  2. 因为以往的方式使用回归的方式,回归出当前帧中目标所在的位置,需要从图片中回归非常多个patches,这是一个非常耗时的过程。
    因此,深度学习的跟踪算法很多只能达到4fps
    然而这篇论文GOTURN的成果可以达到100fps,正如我们在题目中说到的那样
    成果1:
    使用离线训练的方式,提升测试运行速率
    成果2:
    仅使用前后两帧图片进行目标跟踪,提升识别速率

二 论文精读

本篇论文的研究背景:
传统目标检测算法采用在线更新的方式
而离线更新的方式可以用数据集来训练旋转、变换视角、光照变换和其他挑战

在测试的时候,我们要进行跟踪,这个时候就把参数权重都固定住,体系了离线训练的迅速、高鲁棒性及准确率高的等特点
本网络可以识别多物体种类,训练了车,可以跟踪人

算法流程:
只取用前后两帧进行目标位置的评判。
在这里插入图片描述
什么是拉普拉斯分布?
是一种连续概率分布,可以将其看为两个不同位置的指数分布背靠背拼接在一起的
和高斯分布很像

本文使用的损失函数:
L1损失函数
在这里插入图片描述
实验部分

数据增广:避免过拟合
对图片进行一定程度的形变
数据集部分包含视频和图片
1.训练集
源于ALOV300+
2.测试集
源于VOT2014

本篇文章论证了:
数据增强多少有效!
全连接层个数多少效果最好!
等等,有一篇辅助论证论文

三 代码实现

GOTURN源码–tensorflow实现

四 问题思索

1、通过文字或者图片的形式写下这篇论文中GOTURN的技术流程,根据自己的记忆画出文章网络结构。

2、对文中每一个公式进行整理并且要写下自己对这个公式的理解,深刻理解训练阶段的参数,对训练阶段的参数设置进行总结。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值