说明:该系列博客源码链接为:https://github.com/bilylee/SiamFC-TensorFlow,是实验室同小组的师兄用TensorFlow实现SiameseFC算法的最终公开版本,经过了长时间的打磨,各个模块功能明确,整体可读性和可移植性极好,我相信这对做Tracking的小伙伴来说,是个入门SiameseFC Tracker的特别好的选择。哈哈,觉得代码很棒的小伙伴们可以点个Star哦,也欢迎交流学习和指教。
上一篇介绍跑SiameseFC代码的主要流程,这一篇主要介绍开始训练自己的模型的第一步:训练数据预处理。
1:VID2015相关链接
ImageNet比赛官网 :http://image-net.org/challenges/LSVRC/,可以了解比赛信息,包含各比赛实验数据。
VID2015数据下载链接:http://bvisionweb1.cs.unc.edu/ilsvrc2015/download-videos-3j16.php#vid
2:ILSVRC2015 VID数据
解压缩之前,数据大小约86G,解压缩之后的文件夹目录如下:
ImageSets:包含一些.txt文件,子数据集的相关描述,预处理过程中用不到,可忽略。
Data :存储的所有数据信息,包括了图片(val,train,test)和视频片段(snippets)。
Annotations:对应的Data中图片的注释信息,包括val和train部分。
Data子文件夹VID下的文件目录如下:
查看当前文件目录下的文件数量命令:(R代表包含子目录)
ls -lR|grep"^-"| wc -l
可通过上面的指令进入到对应的文件夹中统计VID数据的详细信息如下:
Snippets : 3862+ 555 + 937 = 5354 videos
Train : 3862 videos ( 1122397 images )
Val : 555 videos ( 176126 images )
Test : 937 videos ( 315175 images )
Annotations子文件夹VID下的文件目录如下:
只包含了val和train部分,和上面Data/VID/val和train相对应,存储的是每个图片的.xml格式的标注信息。
挑出来一个.xml文件看看里面长什么样,如下:
.xml注释文件有我们需要用到的folder,filename,size,trackid,bndbox等信息,后面会解析出相关的信息的,说明一下这个trackid很重要,同一个image中有多个trackid说明包含该image的短视频存在着很多个目标,在后面就会解析出来更多的videos,记住这点对看后面的数据处理有帮