上一篇我们利用caffe通过lenet卷积神经网络训练了mnist数据集,得到了对应的lenet_iter_10000.caffemodel模型,下来我们需要通过python方式,利用此模型识别自己手写任意大小数字。
参考博文:http://www.cnblogs.com/denny402/p/5685909.html
不过参考的博文是针对RGB三通道的caffemodel的使用,我们这边的mnist是灰度图片,所以需要修改才能使用
测试图片:215*255像素
1.在caffe根目录新建mnist_test.py文件
#coding=utf-8
#加载必要的库
import numpy as np
import sys,os
#设置当前目录
root = '/home/caffe/'
sys.path.insert(0, root + 'python')
import caffe
os.chdir(root)
deploy=root + 'examples/mnist/lenet.prototxt' #deploy文件
caffe_model=root + 'examples/mnist/lenet_iter_10000.caffemodel' #训练好的 caffemodel
img=root+'examples/mnist/test/1.jpg' #自己手写的任意大小图片
labels_filename = root + 'examples/mnist/labels.txt' #类别名称文件,将数字标签转换回类别名称
net = caffe.Net(deploy,caffe_model,caffe.TEST) #加载model和network
#图片预处理设置
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) #设定图片的shape格式(64,1,28,28)
transformer.set_transpose('data', (2,0,1)) #改变维度的顺序,由原始图片(28,28,1)变为(1,28,28)
#transformer.set_mean('data', np.load(mean_file).mean(1).mean(1)) #减去均值,前面训练模型时没有减均值,这儿就不用
transformer.set_raw_scale('data', 255) # 缩放到【0,255】之间
#transformer.set_channel_swap('data', (2,1,0)) #交换通道,将图片由RGB变为BGR(重点一:此处可以注释 因为训练的mnist本身就是灰度图片,所以没有RGB一说,不注释会报:Exception: Channel swap needs to have the same number of dimensions as the input channels.大致意思就是)
im=caffe.io.load_image(img,color=False) #加载图片(重点二:此处第二个参数color=False一定要补上 不然默认加载成3通道图片,会报错,大致意思就是我们net里定义的是1通道的,与实际不符ValueError: could not broadcast input array from shape (3,28,28) into shape (64,1,28,28))
net.blobs['data'].data[...] = transformer.preprocess('data',im) #执行上面设置的图片预处理操作,并将图片载入到blob中
#执行测试
out = net.forward()
labels = np.loadtxt(labels_filename, str, delimiter='\t') #读取类别名称文件
prob1= net.blobs['prob'].data[0].flatten() #取出最后一层(Softmax)属于某个类别的概率值,并打印
print prob1
order=prob1.argsort()[-1] #将概率值排序,取出最大值所在的序号
print 'the class is:',labels[order] #将该序号转换成对应的类别名称,并打印
2.labels.txt文件 分类结果的映射
0 Zero
1 One
2 Two
3 Three
4 Four
5 Five
6 Six
7 Seven
8 Eight
9 Nine
3.运行python文件
python mnist_test.py