1、准备数据集
这一步就是想方设法搞来训练数据,可以是图像,可以是语音文件、视频等等。
ok,现在假设你找到了所需的数据集(本教程就以图片为例),数据集需要进行预处理,这部分工作量比较大,需要将庞大的数据集人工分类好。
每个文件夹下就是相应的图片,然后将每一类的图片重命名,切记:不同类的图片要有区别,比如bus类的图片命名为300-399(因为我这里每一类的图片不超过100张,所以用三位数表示,一般命名为六位数数字串),dinosaur类图片为400-499....以此类推,命名完所有类别图片。