利用keras（tensorflow）做cnn mnist识别

最新推荐文章于 2024-08-02 12:58:05 发布

szx_0101

最新推荐文章于 2024-08-02 12:58:05 发布

阅读量8.3k

点赞数 3

分类专栏：深度学习图像识别文章标签： cnn神经网络 mnist手写体数字识别 tensorflow之构建自己的数据集

本文链接：https://blog.csdn.net/shizhengxin123/article/details/72383728

版权

深度学习图像识别专栏收录该内容

4 篇文章 0 订阅

订阅专栏

keras图像数据处理以及图像识别小例子

1、数据预处理
数据集请自行下载，数据不大，20来兆
数据具体如下所示：
这里写图片描述
格式为要识别的数字.序号.jpg

数据预处理代码，我用的是tensorflow做后端的keras，所以输入维度为（样本量，高，宽，通道）

import os
from PIL import Image
import numpy as np

#读取文件夹mnist下的42000张图片，图片为灰度图，所以为1通道，
#如果是将彩色图作为输入,则将1替换为3,图像大小28*28
def load_data():
    data = np.empty((42000,1,28,28),dtype="float32")
    label = np.empty((42000,),dtype="uint8")

    imgs = os.listdir("d:/mnist")
    num = len(imgs)
    for i in range(num):
        img = Image.open("d:/mnist/"+imgs[i])
        arr = np.asarray(img,dtype="float32")
        data[i,:,:,:] = arr
        label[i] = int(imgs[i].split('.')[0])
    data = data.reshape(42000,28,28,1)
    return data,label

data , label = load_data()

2、cnn大法
代码如下，很简单的用了几层卷积和池化，应该都能看懂，最后训练正确率95左右

from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers.core import Dense, Dropout, Activation, Flatten
from keras.layers.advanced_activations import PReLU
from keras.layers.convolutional import Convolution2D, MaxPooling2D
from keras.optimizers import SGD, Adadelta, Adagrad
from keras.utils import np_utils, generic_utils
from six.moves import range
#加载数据
data, label = load_data()
print(data.shape[0], ' samples')
#label为0~9共10个类别，keras要求格式为binary class matrices,转化一下，直接调用keras提供的这个函数
label = np_utils.to_categorical(label, 10)
train_data = data[:40000]
train_labels = label[:40000]

validation_labels = label[40000:]
validation_data = data[40000:]
###############
#开始建立CNN模型
###############
#生成一个model
model = Sequential()
#第一个卷积层，4个卷积核，每个卷积核大小5*5。1表示输入的图片的通道,灰度图为1通道。
#border_mode可以是valid或者full，具体看这里说明：http://deeplearning.net/software/theano/library/tensor/nnet/conv.html#theano.tensor.nnet.conv.conv2d
#激活函数用relu
#你还可以在model.add(Activation('tanh'))后加上dropout的技巧: model.add(Dropout(0.5))
model.add(Convolution2D(4, 5, 5,input_shape=(28, 28,1)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
#第二个卷积层，8个卷积核，每个卷积核大小3*3。4表示输入的特征图个数，等于上一层的卷积核个数
#激活函数用relu
#采用maxpooling，poolsize为(2,2)
model.add(Convolution2D(8, 3, 3))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
#第三个卷积层，16个卷积核，每个卷积核大小3*3
#激活函数用tanh
#采用maxpooling，poolsize为(2,2)
model.add(Convolution2D(16, 3, 3))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

#全连接层，先将前一层输出的二维特征图flatten为一维的。
#全连接有128个神经元节点,初始化方式为normal
model.add(Flatten())
model.add(Dense(128))
model.add(Activation('relu'))
model.add(Dropout(0.5))
#Softmax分类，输出是10类别
model.add(Dense(10))
model.add(Activation('softmax'))

#############
#开始训练模型
##############
#使用SGD + momentum
#model.compile里的参数loss就是损失函数(目标函数)


model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])


model.fit(train_data, train_labels,
          nb_epoch=10, batch_size=100,
          validation_data=(validation_data, validation_labels))


json_string = model.to_json()
open('d:/my_model_architecture.json','w').write(json_string)
model.save_weights('d:/firsttry.h5')