神经网络与深度学习—第三周学习总结3.26-CSDN博客

本文链接：https://blog.csdn.net/qq_46029203/article/details/129780205

4.性能优化

在这里插入图片描述

在这里插入图片描述

RMSProp 解决 AdaGrad 方法中学习率过度衰减的问题
在这里插入图片描述

待解决问题：权值𝐰取何值，指标函数𝐽(𝐰)最小？恰恰是最优化方法中的基本问题：函数最小化。
进一步，我们希望建立迭代形式，并且形式尽量简单，类似
基本BP算法(最速梯度法): $\omega_{k+1} = \omega_{k} + \alpha_{k}p_{k}$
基本思想
全局极小点, 局部极小点
◼ 一阶条件：必要条件𝛻𝑓（x）= 0 (驻点)
◼ 二阶条件：充分条件 H半正定
◼ 鞍点：沿某方向是极大值点，沿另一方向是极小值。

在这里插入图片描述

训练数据与测试数据:
数据包括：
➢ 训练数据
➢ 验证数据
➢ 测试数据
通常三者比例为70%，15%，15%或60，20，20当数据很多时，训练和验证数据可适当减少。

训练数据与测试数据：𝐾折交叉验证
原始训练数据被分成 K 个不重叠的子集。然后执行 K 次模型训练和验证，每次在 K−1 个子集上进行训练，并在剩余的一个子集（在该轮中没有用于训练的子集）上进行验证。最后，通过对 K 次实验的结果取平均来估计训练和验证误差。

欠拟合与过拟合：
➢ 欠拟合：误差一直比较大
➢ 过拟合：在训练数据集上误差小而在测试数据集上误差大

在这里插入图片描述

在这里插入图片描述
Pytorch：
PyTorch是一个Python的深度学习库。它最初由Facebook人工智能研
究小组开发，而优步的Pyro软件则用于概率编程。

使用基本概念：

张量（Tensor）是一个物理量，对高维(维数 ≥ 2) 的物理量进行“量纲分析” 的一种工具。简单的可以理解为：一维数组称为矢量，二维数组为二阶张量，三维数组为三阶张量…
计算图用“结点”（nodes）和“线”(edges)的有向图来描述数学计算的图像。“节点” 一般用来表示施加的数学操作，但也可以表示数据输入的起点/输出的终点，或者是读取/写入持久变量的终点。“线”表示“节点”之间的输入/输出关系。这些数据“线”可以输运“size可动态调整”的多维数据数组，即“张量”（tensor）
使用 tensor 表示数据
使用 Dataset、DataLoader 读取样本数据和标签
使用变量 (Variable) 存储神经网络权值等参数
使用计算图 (computational graph) 来表示计算任务
在代码运行过程中同时执行计算图