论文笔记(一) GOTURN

GOTURN算法基于深度学习和卷积网络,利用孪生网络结构进行目标跟踪。通过L1-Loss损失函数避免梯度消失,通过样本扩充增强网络鲁棒性。在不同数量的训练视频上,算法的精确度和鲁棒性均有所提升,平均运行时间为6.05ms/帧。研究还探讨了模型的通用性和专用性,并指出在某些特定情况下的表现。
摘要由CSDN通过智能技术生成

一.算法原理

       GOTURN(Generic Object Tracking Using Regression Networks)这个算法没有过多的图像处理过程,主要是利用了卷积神经网络的特性进行学习。其中网络的结构类似于孪生网络(Siamese Network),采用两输入的方式。通过输入前后两幅图像,输出目标的窗口(左上角坐标和右下角坐标)。

    假设目标窗口的长宽分别是wh,假设相邻两帧图像中目标的变化区域不大。对于第一帧图像,我们先人为设定目标区域中心点,然后利用窗口长宽设置跟踪窗口,为了更好的捕捉目标的变化,将将网络输入中的前后两帧中的目标搜索窗口扩大,具体方式见下图:


    在本研究中选取k1=k2=2,可以发现如果目标出现突变,那么k值将需要取得很大,因此在平滑的变化场景中效果会更好。

        其中,卷积层是采用的5层结构(这里的5层结构是参照了CaffeNet里面的结构,其中卷积层的激励函数都采用了relu激励函数,部分卷积层后面添加了池化层),而全连接层则是由3层,每层4096个节点,各层之间采用dropoutrelu

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值