本篇文章讲的是如何使用TLD算法制作数据集
这个项目呢,其实是我一个大项目的一个分支,我的大项目是要使用深度学习的方法对一个目标进行跟踪,目标是现实生活中的一件物品,在这里我就用一个遥控小车代替。而本篇文章讲的就是如何快速制作这个小车的数据集
我在本项目中使用的是TLD c++代码,在win10下,用VS2013跑起来的,参考的是PASCAL VOC数据集的格式
一、简单介绍PASCAL VOC数据集
PASCAL VOC是一个用于深度学习的数据集,里面有20个类别,可以进行目标分类、位置检测、语义分割等工作。如果使用过的都知道,它的框架里有两个很重要的组成部分,就是原始图片和标签数据,分别存放在JPEGImages和Annotations两个文件夹下,这两份数据是最最原始的数据,也是我们需要手动获取的,不可能写个python脚本自动生成
对于大部分人来讲,生成这些数据都是自己录像、拍照片或是从网上下载图片,然后再使用labelImg去一个一个地生成标签,这样很费事,很累,像我这么懒的肯定不会对着几万张图片一个一个操作了,这么重的体力活明显不适合我
于是我就想有没有一个简单快速的方法来做这件事呢?
二、简单介绍TLD算法
当然是有的呀,没有还写什么博客啊:)
TLD算法是一个传统的目标检测算法,可以用来对目标进行长时间跟踪,亲测可用
这个算法在一开始,让你在屏幕上用鼠标圈一个区域,然后算法就把这个区域当成目标进行长时间的跟踪。该算法由跟踪、检测、学