深度学习-初识Tensorflow框架、Keras框架（上篇笔记）

最新推荐文章于 2024-06-01 18:00:00 发布

Mr.Huang Tony

最新推荐文章于 2024-06-01 18:00:00 发布

阅读量796

点赞数

分类专栏：深度学习文章标签：深度学习 Tensorflow Keras MINIST

本文链接：https://blog.csdn.net/weixin_42036617/article/details/90313548

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

在这里插入图片描述
以下为读书笔记

摘要

这篇文章主要记述了博主初识深度学习的过程包括安装Tensorflow,，Keras的方法和其中遇到的问题，并以MINIST（基于TensorFlow）为例子分别构建线性层的Softmax回归模型和多层卷积神经网络Softmax回归模型来学习框架的使用。

环境说明

环境：

windows10
python3.7
编译器：Spyder3.3.3

其他：

Annaconda：开源的包、环境管理器，里面集成了Python的库，如numpy、matplot等，博主之前装了Python3.7，又下载了Annaconda：在其中配置了Python3.6环境，很是方便，直接去官网Download自己需要的版本就好：Annaconda官网！

小谈TensorFlow和Keras

TensorFlow

概念

Google的TensorFlow开源深度学习框架可以理解为是一个“数学函数”集合和AI训练学习的执行框架，在世界深度学习框架范围内拥有最高的知名度，通过它我们只需要少量的代码就可以很好地完成AI模型的建立和训练，而不需要很强的编程功底，对科学研究人员是一大福利，我想这也许也是Python迅速崛起的原因，毕竟大多数人没有那么多时间去学习复杂的C++。

有关TensorFlow的内容欢迎访问TensorFlow中文社区
在这里插入图片描述

Keras

概念

Keras是一个高级神经网络API，用Python编写，支持python2.7-3.6，能够在Tensorflow,CNTK或Theano之上运行，它的开发重点是实现快速研究（简单来说就是比Tensorflow使用方便，框架更灵巧简约，运算速度更快）

Keras设计原则

用户友好：Keras是专为人类设计的API，以用户体验为中心。Keras遵循减少认知并进行高效研究：它提供一致且简单的API，最大限度减少用户所需操作的东西，并且可以根据用户错误提供清晰且可操作的反馈。
模块化：模型被理解为独立的，完全可配置的模块的序列或图形，可以通过尽可能少的限制将其插入到一起。特别是，神经层，成本函数，优化器，初始化方案，激活函数和正则化方案都是独立的模块，您可以将它们组合在一起以创建新模型。
易扩展性:新模块易于添加（作为新类和函数），现有模块提供了充足的示例。为了能够轻松创建新模块，可以实现全面的表现力，使Keras适合高级研究。
使用Python:没有声明格式的单独模型配置文件。模型在Python代码中描述，它紧凑，易于调试，并且易于扩展。

在这里插入图片描述

有关于Keras框架的使用将会在下一篇博客中以CNN图片分类为例讲解。

前期准备

安装Tensorflow、Keras

在Annaconda->Annaconda Prompt中输入

pip install tensorflow
pip install keras

ps:在安装的过程中可能会出现让你安装其他各种包的情况，如果在Prompt下载太慢，则可以复制下载链接到迅雷上下载，再回到Prompt中pip install 包的名称（注意路径），就可以很快完成

查看版本

这篇文章中所使用的Keras版本为2.2.4，backend是Tensorflow

import keras
print(keras.__version__)

Tensorflow版本为1.13.1

import tensorflow as tf
print(tf.__version__)

实例工作

MNIST-手写数字识别

这个实例在深度学习中的地位≈“hello word”在C语言的地位，这几乎是初识Tensorflow的学生都会学习的一个教程。

简单说明MNIST

MNIST是由6万张训练图片和1万张测试图片构成的，每张图片都是28*28大小（单位：像素），而且都是黑白色构成，（这里的黑色是一个0-1的浮点数，黑色越深表示数值越靠近1），这些图片是采集的不同的人手写从0到9的数字。TensorFlow将这个数据集和相关操作封装到了库中。
MINIST下载解压后文件
这些图片并不是传统意义上的png或者jpg格式的图片，因为png或者jpg的图片格式，会带有很多干扰信息（如：数据块，图片头，图片尾，长度等等），这些图片会被处理成很简易的二维数组，如图：
在这里插入图片描述
可以看到，矩阵中有值的地方构成的图形，跟左边的图形很相似（注意左边的值并不都是1，个人觉得这是代表像素值）。之所以这样做，是为了让模型更简单清晰。特征更明显。

模型代码：

```
import tensorflow as tf
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)
x = tf.placeholder(tf.float32, [None, 784])
# w表示每一个特征值（像素点）会影响结果的权重
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))
y = tf.matmul(x, W) + b
# 是图片实际对应的值
y_=tf.placeholder(tf.float32, [None, 10])
cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
sess = tf.InteractiveSession()
tf.global_variables_initializer().run()
  # mnist.train 训练数据
for _ in range(1000):
  batch_xs, batch_ys = mnist.train.next_batch(100)
  sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})
 
  #取得y得最大概率对应的数组索引来和y_的数组索引对比，如果索引相同，则表示预测正确
correct_prediction = tf.equal(tf.arg_max(y, 1), tf.arg_max(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))
 
print(sess.run(accuracy, feed_dict={x: mnist.test.images,y_: mnist.test.labels}))
```

下面讲解几个概念单词：

占位符（TensorFlow运行计算输入的值）

x = tf.placeholder(tf.float32, [None, 784])

这里的x就是一个占位符，是一个28*28的浮点数2维矩阵（2维张量），分配给它的shape为[None, 784]，其中784是一张展平的MNIST图片的维度（就是把2维矩阵（2维张量）转为为1维数组（1维张量）），None表示此张量的第一个维度可以使任何长度。

把28*28二维张量转化为的1*784一维张量的过程是为了更加清晰的查看，mnist.train.image就是一个[6000,784]的二维张量，行代表每一张图片，列代表每张图片的像素的强度值。

y_=tf.placeholder(tf.float32, [None, 10])

y_也是2维张量，其中每一行为一个10个数的一维向量,用于代表对应某一MNIST图片的类别，例如如果是真实数字是7的话，一行的结果为[0 0 0 0 0 0 1 0 0 0]，这也是我们常说的标签数据，mnist.train.labels是一个[60000,10]的二维张量。

变量（代表一个可修改的张量）

W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

在TensorFlow中，模型参数一般用Variable表示，我们在调用tf.Variable的时候传入初始值。在这个例子里，我们把W和b都初始化为零向量。W是一个784x10的矩阵（因为我们有784个特征和10个输出值）。b是一个10维的向量（因为我们有10个分类）。

Softmax回归（就一行，还是核心代码）

y = tf.nn.softmax(tf.matmul(x,W) + b)

单个样本被预测出来是哪个数字的概率，输入到tf.nn.softmax函数里面。
$y = s o f t m a x (W x + b)$

我们先用了几行简短的代码来设置变量，然后只用了一行代码来定义我们的模型。TensorFlow不仅仅可以使softmax回归模型计算变得特别简单，它也用这种非常灵活的方式来描述其他各种数值计算，从机器学习模型对物理学模拟仿真模型。一旦被定义好之后，我们的模型就可以在不同的设备上运行：计算机的CPU，GPU，甚至是手机！

这样，我们的模型就搭建好了，接下来就是训练、评估、改进了！

训练模型

类别预测与损失函数

可以很容易的为训练过程指定最小化误差用的损失函数，我们的损失函数是目标类别和预测类别之间的交叉熵，交叉熵是用来衡量我们的预测用于描述真相的低效性，它的定义如下：

在这里插入图片描述

y是我们预测的概率分布, y’ 是实际的分布（我们输入的one-hot vector)。

计算交叉熵，我们可以用y_这个占位符用于输入正确值：

y_=tf.placeholder(tf.float32, [None, 10])

然后我们用

在这里插入图片描述

计算交叉熵，代码如下：

cross_entropy = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y))

接着，我们利用梯度下降算法（gradient descent algorithm）以0.5的学习速率最小化交叉熵。

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

TensorFlow在这里实际上所做的是，它会在后台给描述你的计算的那张图里面增加一系列新的计算操作单元用于实现反向传播算法和梯度下降算法。然后，它返回给你的只是一个单一的操作，当运行这个操作时，它用梯度下降算法训练你的模型，微调你的变量，不断减少成本。

开始训练

for _ in range(1000):
  batch_xs, batch_ys = mnist.train.next_batch(100)
  sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

mnist.train.next_batch(1000)是从训练集里一次提取100张图片数据来训练，然后循环1000次，以达到训练的目的。

评估模型

首先让我们找出那些预测正确的标签。tf.argmax能给出某个tensor对象在某一维上的其数据最大值所在的索引值。由于标签向量是由0,1组成，因此最大值1所在的索引位置就是类别标签，比如tf.argmax(y,1)返回的是模型对于任一输入x预测到的标签值，而 tf.argmax(y_,1) 代表正确的标签，我们可以用 tf.equal 来检测我们的预测是否真实标签匹配(索引位置一样表示匹配)。

correct_prediction = tf.equal(tf.arg_max(y, 1), tf.arg_max(y_, 1))

这里返回一个布尔数组。为了计算我们分类的准确率，我们将布尔值转换为浮点数来代表对、错，然后取平均值。例如：[True, False, True, True]变为[1,0,1,1]，计算出平均值为0.75。

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

我们可以计算出在测试数据上的准确率，大概是91%。

print(sess.run(accuracy, feed_dict={x: mnist.test.images,y_: mnist.test.labels}))

在Spder3.3.3中结果如下图所示：

在这里插入图片描述

参考链接：

人人都可以做深度学习应用：入门篇（https://zhuanlan.zhihu.com/p/25482889）

Tensorflow之MNIST解析(https://www.cnblogs.com/lizheng114/p/7439556.html)

TensorFlow中文社区（http://www.tensorfly.cn/）

Mr.Huang Tony

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
深度学习-初识Tensorflow框架、Keras框架（上篇笔记）

这篇文章主要记述了博主安装Tensorflow,，Keras的过程，其中遇到的问题，并以MINIST（基于Tensorflow）和CNN图片分类（基于Keras）学习两种框架的使用，最后对比一下两种框架以便在后期的学习更好的选择。
复制链接

扫一扫

专栏目录