DeepLearning tutorial（6）易用的深度学习框架Keras简介

最新推荐文章于 2024-08-17 11:51:16 发布

wepon_

最新推荐文章于 2024-08-17 11:51:16 发布

阅读量6.5w

点赞数 27

分类专栏： Machine Learning 文章标签：深度学习框架 keras theano cnn

本文链接：https://blog.csdn.net/u012162613/article/details/45397033

版权

本文介绍了Keras，一个基于Theano的深度学习框架，其特点是高度模块化，支持GPU和CPU。内容包括Keras的简介、核心模块如Optimizers、Layers、Preprocessing和Models的介绍，以及一个使用CNN对Mnist数据集进行分类的实例。Keras简化了神经网络的构建过程，适合快速开发。

摘要由CSDN通过智能技术生成

致读者：本文写于keras开发初期，目前keras已经迭代到1.0版本，很多API都发生了较大的变化，所以本文的粘贴的一些代码可能已经过时，在我的github上有更新后的代码，读者需要的话可以看github上的代码：https://github.com/wepe/MachineLearning

之前我一直在使用Theano，前面五篇Deeplearning相关的文章也是学习Theano的一些笔记，当时已经觉得Theano用起来略显麻烦，有时想实现一个新的结构，就要花很多时间去编程，所以想过将代码模块化，方便重复使用，但因为实在太忙没有时间去做。最近发现了一个叫做Keras的框架，跟我的想法不谋而合，用起来特别简单，适合快速开发。

1. Keras简介

Keras是基于Theano的一个深度学习框架，它的设计参考了Torch，用Python语言编写，是一个高度模块化的神经网络库，支持GPU和CPU。使用文档在这：http://keras.io/，这个框架貌似是刚刚火起来的，使用上的问题可以到github提issue:https://github.com/fchollet/keras　

下面简单介绍一下怎么使用Keras，以Mnist数据库为例,编写一个CNN网络结构，你将会发现特别简单。

2. Keras里的模块介绍

Optimizers

顾名思义，Optimizers包含了一些优化的方法，比如最基本的随机梯度下降SGD,另外还有Adagrad、Adadelta、RMSprop、Adam，一些新的方法以后也会被不断添加进来。
```
keras.optimizers.SGD(lr=0.01, momentum=0.9, decay=0.9, nesterov=False)
```
上面的代码是SGD的使用方法，lr表示学习速率,momentum表示动量项，decay是学习速率的衰减系数(每个epoch衰减一次),Nesterov的值是False或者True，表示使不使用Nesterov momentum。其他的请参考文档。
Objectives

这是目标函数模块，keras提供了mean_squared_error，mean_absolute_error
，squared_hinge，hinge，binary_crossentropy，categorical_crossentropy这几种目标函数。

这里binary_crossentropy 和 categorical_crossentropy也就是常说的logloss.
Activations

这是激活函数模块，keras提供了linear、sigmoid、hard_sigmoid、tanh、softplus、relu、softplus，另外softmax也放在Activations模块里(我觉得放在layers模块里更合理些）。此外，像LeakyReLU和PReLU这种比较新的激活函数，keras在keras.layers.advanced_activations模块里提供。
Initializations

这是参数初始化模块，在添加layer的时候调用init进行初始化。keras提供了uniform、lecun_uni