思路:通过构建一个三层的CNN网络,实现数字识别。(图像处理问题)
#导入各种用到的模块组件
from __future__ import absolute_import
from __future__ import print_function
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers.core import Dense,Dropout,Activation,Flatten
from keras.layers.advanced_activations import PReLU
from keras.layers.convolutional import Convolution2D,MaxPooling2D
from keras.optimizers import SGD,Adadelta,Adagrad
from keras.utils import np_utils,generic_utils
from six.moves import range
def load_data():
for i in range(10):
return i
#加载数据
data,label=load_data()
print(data.shape[0],'samples')
#label为0~9共10个类别,keras要求格式为binary class metrices,转化下
#直接带哦用kereas提供的这个函数
label=np_utils.to_categorical(label,10)
############
#开始建立CNN模型
#生成一个model
model=Sequential()
#第一个卷积层,4个卷积核,每个卷积核大小为5*5.1表示输入的图片的通道,灰度图为1通道
#border_mode可以是valid或者full
#激活函数用tanh
#还可以在model.add(Activation('tanh'))后加上dropout的技巧:
#model.add(Dropout(0.5))
model.add(Convolution2D(4,1,5,5,border_mode='valid'))
model.add(Activation('tanh'))
#第二个卷积层,8个卷积核,每个卷积核大小3*3.4表示输入的特征图个数,等于上一层的卷积核个数
#激活函数用tanh
#采用maxpooling,poolsize为(2,2),池化常用的方法有:最大值、平均值
model.add(Convolution2D(8,4,3,3,border_mode='valid'))
model.add(Activation('tanh'))
model.add(MaxPooling2D(pool_size=(2,2)))
#第三个卷积层,16个卷积核,每个卷积核大小为3*3
#激活函数用tanh
#采用maxpooling,poolsize为(2,2
model.add(Convolution2D(16,8,3,3,boder_mode='valid'))
model.add(Activation('tanh'))
model.add(MaxPooling2D(pool_size=(2,2)))
#全连接层,先将前一层输出的二维特征图flatten为一维的
#Dense为隐藏层。16是上一层输出的特征图个数。4是根据每个卷积层计算出来的
#(28-5+1)=24 ,(24-3+1)/2=11,(11-3+1)/2=4
#全连接有128个神经元节点,初始化方式为normal
model.add(Flatten())
model.add(Dense(16*4*4,128,init='normal'))
model.add(Activation('tanh'))
#softmax分类器,输出是10类别
model.add(Dense(128,10,init='normal'))
model.add(Activation('softmax'))
#-------开始训练模型---------------
#使用SGD+momentum
#model.compile里的参数就是损失函数(目标函数)
sgd=SGD(l2=0.0,lr=0.05,decay=1e-6,momentum=0.9,nesterov=True)
model.compile(loss='categorical_crossentropy',optimizer=sgd,class_mode='categorical')
#调用fit方法,就是一个训练过程。训练的epoch数设为10,batch_size=100
#数据经过随机打乱shuffle=True。verbose=1,训练过程中输出的信息,0,1,2三种方式都可以,无关紧要
#show_accuracy=True,训练时每一个epoch都输出accuracy
#validation_split=0.2,将20%的数据作为验证集
model.fit(data,label,batch_size=100,nb_epoch=10,shuffle=True,verbose=1,validation_split=0.2)
#fit方法在达到设定的nb_epoch时结束,并且自动地保存了效果最好的model,之后你可以调用model.evaluate()方法对测试数据进行测试,
#还有model.predict_classes,model.predict_proba等方法,具体请看文档