caffe实战三：自己手写数字图片通过mnist的caffe模型进行分类

最新推荐文章于 2020-06-05 12:46:13 发布

硅影AI-麦克

最新推荐文章于 2020-06-05 12:46:13 发布

阅读量625

点赞数

分类专栏： caffe

本文链接：https://blog.csdn.net/gufengowner/article/details/61922181

版权

caffe 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

上一篇我们利用caffe通过lenet卷积神经网络训练了mnist数据集，得到了对应的lenet_iter_10000.caffemodel模型，下来我们需要通过python方式，利用此模型识别自己手写任意大小数字。
参考博文：http://www.cnblogs.com/denny402/p/5685909.html
不过参考的博文是针对RGB三通道的caffemodel的使用，我们这边的mnist是灰度图片，所以需要修改才能使用
测试图片：215*255像素
这里写图片描述

1.在caffe根目录新建mnist_test.py文件

#coding=utf-8
#加载必要的库
import numpy as np

import sys,os
#设置当前目录
root = '/home/caffe/' 
sys.path.insert(0, root + 'python')
import caffe
os.chdir(root)

deploy=root + 'examples/mnist/lenet.prototxt'    #deploy文件

caffe_model=root + 'examples/mnist/lenet_iter_10000.caffemodel'   #训练好的 caffemodel
img=root+'examples/mnist/test/1.jpg'    #自己手写的任意大小图片
labels_filename = root + 'examples/mnist/labels.txt'  #类别名称文件，将数字标签转换回类别名称

net = caffe.Net(deploy,caffe_model,caffe.TEST)   #加载model和network

#图片预处理设置
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})  #设定图片的shape格式(64,1,28,28)
transformer.set_transpose('data', (2,0,1))    #改变维度的顺序，由原始图片(28,28,1)变为(1,28,28)
#transformer.set_mean('data', np.load(mean_file).mean(1).mean(1))    #减去均值，前面训练模型时没有减均值，这儿就不用
transformer.set_raw_scale('data', 255)    # 缩放到【0，255】之间
#transformer.set_channel_swap('data', (2,1,0))   #交换通道，将图片由RGB变为BGR（重点一：此处可以注释 因为训练的mnist本身就是灰度图片，所以没有RGB一说,不注释会报：Exception: Channel swap needs to have the same number of dimensions as the input channels.大致意思就是）



im=caffe.io.load_image(img,color=False) #加载图片（重点二：此处第二个参数color=False一定要补上 不然默认加载成3通道图片，会报错，大致意思就是我们net里定义的是1通道的，与实际不符ValueError: could not broadcast input array from shape (3,28,28) into shape (64,1,28,28)）
net.blobs['data'].data[...] = transformer.preprocess('data',im)      #执行上面设置的图片预处理操作，并将图片载入到blob中

#执行测试
out = net.forward()

labels = np.loadtxt(labels_filename, str, delimiter='\t')   #读取类别名称文件
prob1= net.blobs['prob'].data[0].flatten() #取出最后一层（Softmax）属于某个类别的概率值，并打印
print prob1
order=prob1.argsort()[-1]  #将概率值排序，取出最大值所在的序号 
print 'the class is:',labels[order]   #将该序号转换成对应的类别名称，并打印

2.labels.txt文件分类结果的映射

0 Zero
1 One
2 Two
3 Three
4 Four
5 Five
6 Six
7 Seven
8 Eight
9 Nine

3.运行python文件

python mnist_test.py

4.运行结果

这里写图片描述

硅影AI-麦克

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
caffe实战三：自己手写数字图片通过mnist的caffe模型进行分类

caffe mnist 卷积神经网络 CNN
复制链接

扫一扫

专栏目录