神经网络与深度学习 Class 12：人工神经网络（下）

最新推荐文章于 2024-08-31 08:01:24 发布

By4te

最新推荐文章于 2024-08-31 08:01:24 发布

阅读量233

点赞数

分类专栏：机器学习 Python 文章标签：深度学习神经网络机器学习

本文链接：https://blog.csdn.net/m0_49939117/article/details/121207960

版权

Python 同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

机器学习

36 篇文章 5 订阅

订阅专栏

12.1 小批量梯度下降法

1.批量梯度下降法

每次迭代使用所有样本计算偏导数，不适合大规模数据集

2.随机梯度下降

每次迭代只使用一个样本训练模型，需要训练多轮，无法快速收敛

3.小批量梯度下降

将数据分为多个小批量，每次迭代使用一个小批量来训练模型

损失函数：

t：每批样本数量

公式：

需要多轮训练，每次迭代的训练样本数固定

4.三种算法等高线图

12.2 梯度下降法的优化

非凸函数具有多个局部最优点，在局部极小值点，梯度接近于0，迭代停止，因此多层神经网络使用梯度下降法，无法保证达到最小值点

影响小批量梯度下降法的因素：

1.样本的选择

在每轮训练前，打乱样本顺序

2.批量数

在使用GPU时，使用2的幂数作为批量中的样本数

3.学习率

凸函数中，可以使用学习率衰减，开始训练时设置较大的学习率，加快收敛速度。在迭代过程中，学习率随着迭代次数逐渐减小，避免震荡

非凸函数中，可以周期性的增大学习率或自适应调整学习率

自适应学习率算法：

（1）AdaGrad

（2）RMSprop、AdaDelta

4.梯度

（1）动量梯度下降法

（2）牛顿加速梯度算法

12.3 keras和tf.keras

12.4 Sequential模型

建立模型

添加层

查看摘要

1.构建模型

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #
=================================================================
dense (Dense)                (None, 8)                 40
_________________________________________________________________
dense_1 (Dense)              (None, 4)                 36
_________________________________________________________________
dense_2 (Dense)              (None, 3)                 15
=================================================================
Total params: 91
Trainable params: 91
Non-trainable params: 0

2.配置训练方法

损失函数

优化器

评价指标

3.训练模型

默认值

4.评估模型

5.使用模型

12.5 实例：手写字体识别

设计结构

手写字体为28*28，展开为784的张量，因此输入层有784个单元。

输出层为10个单元，分别对应0-9，使用softmax

隐含层设计128个单元，使用relu