深度学习：算法到实战（三）外一章

最新推荐文章于 2024-07-30 07:00:00 发布

QxwOnly

最新推荐文章于 2024-07-30 07:00:00 发布

阅读量242

点赞数

分类专栏：人工智能深度学习文章标签：算法线性代数深度学习

本文链接：https://blog.csdn.net/qs17809259715/article/details/120117297

版权

1.线性代数：数据表示、空间变换的基础。

2.概率论（统计）：模型假设、策略设计的基础。

3.最优化：求解目标函数的具体算法。

4.信息论：对于不确定性的度量，信息增益选择特征，交叉熵。

5.微积分：链式求导，泰勒展开。
6.矩阵线性变换，矩阵相乘对原始向量同时施加方向变化和尺度变化。对于特征向量，矩阵的作用只有尺度变化而没有方向变化。尺度变化系数就是特征值。
7.线性代数：秩

线性方程组的角度：度量矩阵行列之间的相关性。
数据点分布的角度：表示数据需要的最小的基的数量。

（1）数据分布模式越容易被捕捉，即需要的基越少，秩就越小。
（2）数据冗余度越大，需要的基就越少，秩越小。
（3）若矩阵表达的是结构化信息，如图像、用户-物品表等，各行之间存在一定相关性，一般是低秩的。

8.数据降维，奇异值分解，较大奇异值包含了矩阵的主要信息。
9.低秩近似，其意义保留决定数据分布的最主要的模式/方向（丢弃的可能是噪声或其他不关键信息）。比如：推荐系统，图像去噪等。

在这里插入图片描述

在这里插入图片描述

策略目标：训练误差小 & 泛化错误低
策略设计：无免费午餐定理，脱离具体问题，谈‘什么学习算法更好’ 毫无意义 (周志华)，也就是说没有任何一个模型可以在所有的学习任务里表现最好。
策略设计: 奥卡姆剃刀原理，如果多种模型能够同等程度地符合一个问题的观测结果，应该选择其中使用假设最少的，也就是最简单的模型。
欠拟合：训练集的一般性质尚未被学习器学好，(训练误差大)。
解决方法：提高模型复杂度
● 决策树:拓展分支
● 神经网络:增加训练轮数
过拟合：学习器把训练集特点当做样本的，一般特点. (训练误差小，测试误差大)。
解决方法：降低模型复杂度
● 优化目标加正则项
● 决策树：剪枝
● 神经网络：early stop、dropout
● 数据增广（训练集越大，越不容易过拟合）。计算机视觉：图像旋转、缩放、剪切；自然语言处理：同义词替换；语音识别：添加随机噪声。