【单目标跟踪论文阅读】GOT-10k数据库

文章目录数据库简介创新点主要动机数据库结构总结问题记录数据库简介每一个视频包含种类和运动模式两个标签类别包含五个子类:动物,机动车辆,人员,助力物体和部分运动物体,且类别和语义信息遵循WordNet运动模式基本遵循WordNet,只有六种例外:摄影机动作,舞狮舞龙,跑酷,手推车动力,起跳和高低杠,创新点Got-10k包含560种运动物体的87种运动模式,提供了10,000个视频...
摘要由CSDN通过智能技术生成

数据库简介

在这里插入图片描述

  1. 每一个视频包含种类和运动模式两个标签
  2. 类别包含五个子类:动物,机动车辆,人员,助力物体和部分运动物体,且类别和语义信息遵循WordNet
  3. 运动模式基本遵循WordNet,只有六种例外:摄影机动作,舞狮舞龙,跑酷,手推车动力,起跳和高低杠,

创新点

  1. Got-10k包含560种运动物体的87种运动模式,提供了10,000个视频片段包含1,500,000个人工标注的boundingbox,种类更为丰富
  2. GOT-10k是迄今为止第一个使用WordNet语义层次结构指导类人口的视频轨迹数据集,可确保对各种运动物体进行全面且相对公正的覆盖。
  3. GOT-10k首次引入了用于跟踪器评估的单发协议,其中培训和测试课程是零重叠的。
  4. GOT-10k提供了其他标签,例如运动类别和对象可见比率,从而促进了运动感知和遮挡感知跟踪器的开发。
  5. test set 的420个视频包含了84物体类别和31个运动类别,让实验更加接近真实评估
  6. 提出了类别平衡矩阵mAO和mSR来评价跟踪器效果
  7. 测试了39种主流跟踪器
  8. 测试了训练集不同因素对深度跟踪器结果的影响
  9. 保护test data以防止微调和过拟合的出现
  10. 网址GOT-10k
    这个数据集下载需要提供邮箱,还必须是学校或者特定机构的,反正普通的QQ邮箱和163邮箱是不行的

主要动机

  1. OTB,VOT等数据库,种类太少,规模太小且没提供训练集
  2. LaSOT,TrackingNet,种类窄(20-71种)且训练集和测试集之间类别有重叠,这对模型的泛化以及评价结果会产生偏差
  3. 这两点也是与其他数据库的最大差别

数据库结构

数据采集

  1. 遵循WordNet对名词分类的树状分类方式对名词进行分类
  2. 对所有名词去除已经消失的以及不常用的名词,再对剩余的名词及逆行分类,分类后按照youTube上上传相关名词的热度以及上传视频量进行排序
  3. 数据在类别上存在一些不平衡,这种现象可以被称为长尾分布(Long-Tailed Distribution),这种数据分布现象更接近现实数据分布,对提高模型泛化性有利
  4. “人”这个类别占到整个数据库的24%

BB标注

  1. bounding box标定为旋转举行,以包含最少的目标背景像素为目的
  2. 在标签中增加“可见比例”以表明目标物体在途中被遮挡或者被画框截断的比例是多少,每个类之间的差距是15%

数据集划分

  1. 训练数据和测试数据需要有明显的差异化以达到泛化模型的作用,故训练数据中除了“人”,其他类别没有重叠。人的不同运动类别在训练集和测试集中也没有重叠。
  2. 运动类别多,视频数量300,
  3. 具体分类:
    在这里插入图片描述

实验结果

模型选择

  1. 基于深度网络的模型,均在GOT-10k上重新训练过
  2. 相关滤波法模型
  3. 传统方法

评估方法

  1. AO(average overlap)平均重合度
  2. mAO,考虑到类别平衡,避免多帧序列在平均计算中占据较大权重,故计算公式如下:
    在这里插入图片描述
    C C C代表种类数, S c S_c Sc代表某一种类下的视频序列数
  3. SR:成功率。指在一定AO阈值下成功跟踪的准确度,取0.5和0.75两个阈值
  4. mSR的计算方法同mAO

评估挑战

对影响目标跟踪结果的主要因素进行指标量化以评估不同因素对模型效果的影响

  1. 目标被遮挡和截断
    度量方法: ( 1 − v ) (1-v) (1v), v v v代表目标可见比例
  2. 目标尺度大小变化
    s i / s i − T , s i − T / s i {s_i/s_{i-T}, s_{i-T}/s_i} si/si
  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标跟踪数据集: 1. OTB - Object Tracking Benchmark:一个经典的目标跟踪数据集,包含100个视频序列,涵盖多种对象的形态、尺度、光照、遮挡等变化。 2. VOT - Visual Object Tracking:一个挑战性的目标跟踪数据集,包含数百个视频序列,涵盖多种场景和对象变化。 3. UAV123 - UAV-based Object Tracking:一个专门针对无人机上的目标跟踪任务的数据集,包含123个无人机视频序列。 4. LaSOT - Large-scale Single Object Tracking:一个规模较大的目标跟踪数据集,包含1400个视频序列,涵盖多种场景和对象变化。 5. GOT-10k - Generic Object Tracking Benchmark:一个大规模的通用目标跟踪数据集,包含10,000个视频序列,涵盖多种对象和场景变化。 多目标跟踪数据集: 1. MOTChallenge - Multiple Object Tracking Challenge:一个多目标跟踪竞赛数据集,包含多个子数据集,涵盖多种场景和对象的变化。 2. MOT16、MOT17、MOT20 - Multiple Object Tracking:多个公开的多目标跟踪数据集,涵盖多种场景和对象变化。 3. UA-DETRAC - Urban Autonomous Driving Detection and Tracking:一个专门针对城市自动驾驶场景的多目标跟踪数据集,包含10个城市驾驶场景,涵盖多种车辆和行人的变化。 4. MOT2015 - Multiple Object Tracking:一个多目标跟踪数据集,包含多个子数据集,涵盖多种场景和对象变化。 5. DukeMTMC - Multi-Target, Multi-Camera Tracking:一个多目标多摄像头跟踪数据集,包含多个场景和多个摄像头。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值