每次边做实验边写博客,所以夹杂了英文和拼音,然后回windows修改,抱歉。
标题不改了,用自己的数据集训练模型来分类图片,原来的imagenet图片太多不用。
参考 薛开宇 的博客 用自己的数据训练和测试“CaffeNet” 2014.7.22 (点击打开链接) 和一篇博客点击打开链接
薛开宇前面数据处理讲得好,后者具体实现很详细,各有所长,互通有无。。。
不一步步介绍了,强调几点:
一: test数据集好像没有到,不知道他们都扯这个test干什么
二: find train/cat *.jpeg |cut -d '/' -f2-3 > train.txt 用类似语句生成训练标签,train必须要,不然读不了
三: find val *.jpeg |cut -d '/' -f2-3 > val.txt 生成验证标签,我用的是猫狗训练各50张,猫狗验证各十张,训练图片分开放,验证放一起(猫标1狗标2)
四:后面按照第二个博客一步步来:(作者电脑配置不够没跑通,但是思路清晰,薛开宇 此部分简直不知所云)
接着,报错:
找到配置文件,把第一个batch——size改小,我改成50
跑起来了:
26000时候,识别率65%
30000,还是65%
我想可能图片不规范,猫狗的脸又有点像,验证10数目不够。
把狗换成表,验证集15张图
把生成的模型和数据均值文件删除:
sudo rm -r ils*
继续
sudo ./examples/myself/create_imagenet.sh
接着:
sudo ./examples/myself/make_imagenet_mean.sh
可以看到生成的图像均值:
最后:
sudo ./examples/myself/train_caffenet.sh
看到24000次就达到100%识别率。
参照材料:学习笔记3 用自己的数据训练和测试“CaffeNet” 2014.7.22 薛开宇
Caffe官网 ImageNet tutorial