本文紧接着上一篇 :http://blog.csdn.net/leo_is_ant/article/details/49183275 (训练实践)进行图片分类。
话说上回,我们已经训练出了数据的模型 caffe_model。下面我们用一个caffe提供的Python接口进行一次图片的分类练习。
首先推荐一篇文章 链接在此:http://nbviewer.ipython.org/github/BVLC/caffe/blob/master/examples/00-classification.ipynb
文章中运用了imagenet的网络进行一次训练。本文有一些相似,在实验室的Linux系统上实践可行。
首先 import 相关的package 和选定数据model的路径:
import numpy as np
caffe_root='/home/zyf/caffe-master/'
import sys
sys.path.insert(0,caffe_root+'python')
import caffe
import os
MODEL_FILE = '/home/zyf/caffe-master/examples/mydata/mynet/deploy.prototxt'
PRETRAINED = '/home/zyf/caffe-master/examples/mydata/result/caffenet_train_iter_1000.caffemodel'
IMAGE_ROOT = '/home/zyf/caffe-master/examples/mydata/val/'
紧接着定义我们的网络:
net=caffe.Net(MODEL_FILE,PRETRAINED,caffe.TEST)
看一下caffe python目录下的classifier,里面有一个mean文件。在官方文章中,他们给大家准备好了 ilsvrc_2012_mean.npy 文件
但是我们怎么将自己的model转化成npy文件呢? github 的 https://github.com/BVLC/caffe/issues/290 给出了一个解决方案。主要利用了python 接口的 io.py 工具。 在这里我们code这么处理:
blob = caffe.proto.caffe_pb2.BlobProto()
data = open( '/home/zyf/caffe-master/examples/mydata/mydata_mean.binaryproto' , 'rb' ).read()
blob.ParseFromString(data)
arr = np.array( caffe.io.blobproto_to_array(blob) )
mean_out = arr[0]
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})
transformer.set_transpose('data', (2,0,1))
transformer.set_mean('data',mean_out.mean(1).mean(1)) # mean pixel
transformer.set_raw_scale('data', 255) # the reference model operates on images in [0,255] range instead of [0,1]
transformer.set_channel_swap('data', (2,1,0)) # the reference model has channels in BGR order instead of RGB
这里上面进行 mean.binaryproto 的转码,进行Imagenet网络的基本设置。
下面为了方便,我们从val.txt中的读取图片名字和label做成字典,以备看分类情况。
net.blobs['data'].reshape(50,3,227,227)
files=os.listdir(IMAGE_ROOT)
checkFile=open('/home/zyf/caffe-master/examples/mydata/val.txt')
checkDict={}
for i in checkFile.readlines():
checkDict[i.split()[0]]=i.split()[1]
checkFile.close()
最后我们看net的分配情况,和分类的概率:
for i in files:
net.blobs['data'].data[...] = transformer.preprocess('data', caffe.io.load_image(IMAGE_ROOT+i))
out = net.forward()
print 'picture name:'+i+' shoulud be '+ str(checkDict[i]),' :net predict label : '+str(out['prob'].argmax())
print out['prob'][0]
picture name:1336611-00510.j2k.jpg shoulud be 4 :net predict label : 4
[ 0.05745921 0.24773939 0.08945911 0.16403614 0.4184134 0.02289278]
至此,我们就可以完成任务了~