采用ImageNet方法制作自己的数据进行训练分类器
第一步:数据制作
本篇以红绿灯数据样本为案例,讲解如何自作自己的数据训练样本。
- 首先收集红绿灯三个样本数据集,关于如何收集这里不做重点讲解,网上可以各种下载相应的图片,我们下载的图片有时候大小不统一,因此这里我们编写一个脚本,可以很快的批量处理图片大小统一问题。如图所示
- 将图片大小统一后,有时候下载的不一定是.jpg图片格式,所有这里需要一个图片批量转化脚本,这个脚本也在上图同一文件下。
- 将图片进行分类并存储于同一个文件夹下:以红绿灯为例,分为train,validation两个文件夹,随机分配train、validation的图片数量
第二步:将图片转化为tfrecord格式
在data_prepare文件夹下,打开cmd终端运行如下指令:
python data_convert.py -t pic --train-shards 2 --validation-shards 2 --num-threads 2 --dataset-name trafficlight
第三步:定义新的datasets
在slim/datasets中文件下新建一个trafficlight.py文件,将flowers.py文件复制到其中,按照书籍《21个项目玩转深度学习》第55页修改即可。