keras中文文档_从零开始深度学习第17讲:keras入门及快速上手指南

     深度学习到这个进度,笔者觉得有必要开始对一些优秀的深度学习框架进行介绍了。在前面几讲中,我们着重对 Tensorflow 进行了介绍,并用其实现了一些数据例子。Tensorflow 虽然很强大,但语法和使用便利性上对于新手来说并不是那么的友好,所以到这里笔者需要给大家介绍 keras 了。

4b0b2c4430c4532756274cbabe8a3ebe.png

      keras 是一款使用纯 python 编写的神经网络 API,使用 keras 能够快速实现你的深度学习方案,所以 keras 有着为快速试验而生的美称。keras 以 TensorflowTheanoCNTK 为后端,意思就是 keras 的底层计算都是以以上这些框架为基础的,这使得 keras能够专注于快速搭建起神经网络模型。

keras 搭建神经网络的基本流程

     利用 keras 搭建神经网络模型非常快速和高效,其模型实现的核心流程可以用四个步骤来概括。具体如下:

     第一步就是设计你的网络结构(add):
     调用 keras 神经网络的各个模块来组件你的模型架构,通过 add 方法来叠加。这一步是最需要仔细考虑的地方,关乎你的神经网络的复杂性和高效与否。简单示例如下:

from keras.layers import Dense, Activation
model.add(Dense(units=64, input_dim=100))
model.add(Activation("relu"))
model.add(Dense(units=10))
model.add(Activation("softmax"))

     上面的示例中,我们从 keras 的 layers 模块中导入了 Dense 全连接层、Activation 激活层,构造了一个包含两个全连接层和一个 relu 和 softmax 激活的网络模型。

     第二步是将设计好模型进行编译(compile):

model.compile(loss='categorical_crossentropy', optimizer='sgd', metrics=['accuracy'])

     第三步就是对训练数据进行拟合训练(fit):

model.fit(x_train, y_train, epoche=5, batch_size=32)

     最后就是对训练好的模型进行评估(evaluate):

loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128)

     这样你就用 keras 将你的神经网络模型快速实现了。之后你可以考虑对模型进行调整和优化,但将想法和方案实现落地这个过程是非常快速的。至于 keras 的具体细节和其他的一些功能,大家可以参考 keras 的官方文档:https://keras.io/

d9afe2143b5191eea43016354f8a7611.png

当然也有中文版的:http://keras-cn.readthedocs.io/en/latest/

ae47cfc01203417cfbbaf9aa70f57d2c.png

keras 模拟数据例子

     下面我们用 numpy 生成的随机数的例子来使用 keras 去搭建神经网络,我们模拟一个 softmax 多分类的例子:

import kerasfrom keras.models import Sequentialfrom keras.layers import Dense, Dropout, Activationfrom keras.optimizers import SGD# Generate dummy dataimport numpy as np
x_train = np.random.random((1000, 20))
y_train = keras.utils.to_categorical(np.random.randint(10, size=(1000, 1)), num_classes=10)
x_test = np.random.random((100, 20))
y_test = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)
model = Sequential()# Dense(64) is a fully-connected layer with 64 hidden units.# in the first layer, you must specify the expected input data shape:# here, 20-dimensional vectors.model.add(Dense(64, activation='relu', input_dim=20))
model.add(Dropout(0.5))
model.add(Dense(64, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))
sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='categorical_crossentropy',
             optimizer=sgd,
             metrics=['accuracy'])
model.fit(x_train, y_train,
         epochs=20,
         batch_size=128)
score = model.evaluate(x_test, y_test, batch_size=128)

      模型训练:

5faf34621745b5b55032004ee25aba85.png

     模型总结,这也是 keras 的一个比较好的功能之一,可以让你对了解模型的基本概要:

c45d68b7971d97e2cc324c6016f4e5bd.png

     由模型总结我们看到神经网络每一层的输入输出大小以及需要训练的参数个数,非常明了。

利用 keras 实现 LeNet-5 模型

     在之前的推送中我们使用了 Tensorflow 和 mnist 数据例子来实现了 Yann Lecun 大佬的 LeNet-5 模型,本节我们将继续使用 keras 来搭建 LeNet-5 模型。依然是按照前面所讲到的 keras 搭建神经网络模型四步骤,LeNet-5 模型搭建如下:

import kerasfrom keras.layers import Conv2D, Dense, Dropout, Activation, MaxPooling2D, Flattenfrom keras.models import Sequentialimport numpy as npimport tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_data# define lenet5 modeldef lenet5(X_train, y_train):
   model = Sequential()# first step: create sequential model and add layers
   model.add(Conv2D(6, (5, 5), strides=1, padding='valid',
                    input_shape=(32, 32, 1), activation='relu'))
   model.add(MaxPooling2D(pool_size=(2, 2)))
   model.add(Conv2D(16, (5, 5), strides=1, activation='relu'))
   model.add(MaxPooling2D(pool_size=(2, 2)))
   model.add(Conv2D(1203, (5, 5), strides=1, activation='relu'))
   model.add(Flatten())
   model.add(Dense(84))
   model.add(Activation('relu'))
   model.add(Dropout(0.25))
   model.add(Dense(10))
   model.add(Activation('softmax'))  # second step:compile the model
   model.compile(loss='categorical_crossentropy',
                 optimizer='adam',
                 metrics=['accuracy'])    # third step: fit the model
   model.fit(X_train, y_train, batch_size=128, epochs=10)    return model# fourth step: evaluate the modeldef eval_score(model, X_test, y_test):
   score = model.evaluate(X_test, y_test, batch_size=128)    return scoreif __name__ == '__main__':
   mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
   sess = tf.InteractiveSession()
   X_train = mnist.train.images
   X_train = tf.reshape(X_train, [-1, 28, 28, 1])
   X_train = tf.pad(X_train, [[0,0],[2,2],[2,2], [0,0]]).eval()
   y_train = mnist.train.labels
   X_test = mnist.test.images
   X_test = tf.reshape(X_test, [-1, 28, 28, 1])
   X_test = tf.pad(X_test, [[0,0],[2,2],[2,2], [0,0]]).eval()
   y_test = mnist.test.labels
   model = lenet5(X_train, y_train)
   print(model.summary())
   score = eval_score(model, X_test, y_test)
   print(score)

     在上述代码中,我们利用 keras 四步法快速搭建起了 LeNet5 模型,并使用 mnist 手写数字数据集进行了训练。这里需要说明的一点是,笔者这里的 mnist 数据是通过 Tensorflow 下载导入的,其实 keras 本身也有 mnist 的数据导入模块。这么做主要是笔者想要通过 Tensorflow 对训练集的维度做 padding 时方便,mnist 数据集输入大小的 shape 为 28x28x1,但在 Lecun 的论文原文中,输入图像是 32x32x1,所以在搭建原始的 LeNet5 结构时需要对输入在一开始就做一个 padding。

模型训练过程如下:

e7b814a6a29b98d9952d5bd9187ea3cd.png

模型概要如下:

624513fbb0c5b2dbaba68f6af7f56100.png

最后我们使用 LeNet5 在测试集上取得了 99.01% 的准确率:

fb1fe6e9e326d3a5d75e9627ec8787b7.png

参考资料:

https://keras.io/

推荐阅读

从零开始深度学习第16讲:CNN经典论文研读之AlexNet及其TensorFlow实现

从零开始深度学习第15讲:ubuntu16.04 下深度学习开发环境搭建与配置

从零开始深度学习第14讲:CNN经典论文研读之Le-Net5及其TensorFlow实现

从零开始深度学习第13讲:Tensorflow实战之mnist手写数字识别

从零开始深度学习第12讲:卷积神经网络的Tensorflow实现

Keras:基于Theano和TensorFlow的深度学习库 这就是Keras Keras是一个高层神经网络库,Keras由纯Python编写而成并基Tensorflow或Theano。Keras 为支持快 速实验而生,能够把你的idea迅速转换为结果,如果你有如下需求,请选择Keras: 简易和快速的原型设计(keras具有高度模块化,极简,和可扩充特性) 支持CNN和RNN,或二者的结合 支持任意的链接方案(包括多输入和多输出训练) 无缝CPU和GPU切换 Keras适用的Python版本是:Python 2.7-3.5 Keras的设计原则是 模块性:模型可理解为一个独立的序列或图,完全可配置的模块以最少的代价自由组合在一起。具 体而言,网络层、损失函数、优化器、初始化策略、激活函数、正则化方法都是独立的模块,你可 以使用它们来构建自己的模型。 极简主义:每个模块都应该尽量的简洁。每一段代码都应该在初次阅读时都显得直观易懂。没有黑 魔法,因为它将给迭代和创新带来麻烦。 易扩展性:添加新模块超级简单的容易,只需要仿照现有的模块编写新的类或函数即可。创建新模 块的便利性使得Keras更适合于先进的研究工作。 与Python协作:Keras没有单独的模型配置文件类型(作为对比,caffe有),模型由python代码描 述,使其更紧凑和更易debug,并提供了扩展的便利性。 Keras从2015年3月开始启动,经过一年多的开发,目前Keras进入了1.0的时代。Keras 1.0依然遵循相 同的设计原则,但与之前的版本相比有很大的不同。如果你曾经使用过此前的其他版本Keras。你或许 会关心1.0的新特性。 泛型模型:简单和强大的新模块,用于支持复杂深度学习模型的搭建。 更优秀的性能:现在,Keras模型的编译时间得到缩短。所有的RNN现在都可以用两种方式实现, Keras中文文档 以供用户在不同配置任务和配置环境下取得最大性能。现在,基于Theano的RNN也可以被展开, 以获得大概25%的加速计算。 测量指标:现在,你可以提供一系列的测量指标来在Keras的任何监测点观察模型性能。 更优的用户体验:我们面向使用者重新编写了代码,使得函数API更简单易记,同时提供更有效的 出错信息。 新版本的Keras提供了Lambda层,以实现一些简单的计算任务。 ... 如果你已经基于Keras0.3编写了自己的层,那么在升级后,你需要为自己的代码做以下调整,以 在Keras1.0上继续运行。请参考编写自己的层 关于Keras-cn 本文档Keras文档中文版,包括keras.io的全部内容,以及更多的例子、解释和建议,目前,文档 的计划是: 1.x版本:现有keras.io文档中文翻译,保持与官方文档的同步 2.x版本:完善所有【Tips】模块,澄清深度学习中的相关概念和Keras模块的使用方法 3.x版本:增加Keras相关模块的实现原理和部分细节,帮助用户更准确的把握Keras,并添加更多 的示例代码 现在,keras-cn的版本号将简单的跟随最新的keras release版本 由于作者水平和研究方向所限,无法对所有模块都非常精通,因此文档中不可避免的会出现各种错误、 疏漏和不足之处。如果您在使用过程中有任何意见、建议和疑问,欢迎发送邮件 到moyan_work@foxmail.com与我取得联系。 您对文档的任何贡献,包括文档的翻译、查缺补漏、概念解释、发现和修改问题、贡献示例程序等,均 会被记录在致谢,十分感谢您对Keras中文文档的贡献! 同时,也欢迎您撰文向本文档投稿,您的稿件被录用后将以单独的页面显示在网站中,您有权在您的网 页下设置赞助二维码,以获取来自网友的小额赞助。 如果你发现本文档缺失了官方文档的部分内容,请积极联系我补充。 本文档相对于原文档有更多的使用指导和概念澄清,请在使用时关注文档中的Tips,特别的,本文档的 额外模块还有: 一些基本概念:位于快速开始模块的一些基本概念简单介绍了使用Keras前需要知道的一些小知 识,新手在使用前应该先阅读本部分的文档Keras安装和配置指,提供了详细的Linux和Windows下Keras的安装和配置步骤。 深度学习Keras:位于导航栏最下方的该模块翻译了来自Keras作者博客keras.io和其他Keras相关 博客的文章,该栏目的文章提供了对深度学习的理解和大量使用Keras的例子,您也可以向这个栏 目投稿。 所有的文章均在醒目位置标志标明来源与作者,本文档对该栏目文章的原文不具有任何处 置权。如您仍觉不妥,请联系本人(moyan_work@foxmail.com)删除。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值