1 机器学习数学总结

最新推荐文章于 2021-03-07 23:19:34 发布

chenxl929

最新推荐文章于 2021-03-07 23:19:34 发布

阅读量2.1k

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/chenxl929/article/details/79571432

版权

本文是学习机器学习的数学总结，涵盖了线性代数、概率与信息论的基础知识。在线性代数部分，详细讲解了矩阵和向量相乘、单位矩阵、逆矩阵、线性相关、特征分解等内容。在概率与信息论部分，介绍了随机变量、概率分布、条件概率、信息熵和KL散度等概念。这些知识对于理解深度学习和机器学习算法至关重要。

摘要由CSDN通过智能技术生成

前言：此为学习《深度学习》所做笔记。

参考：《深度学习》、《机器学习》-周志华、《统计学习方法》-李航。

对于方程组 Ax = b 而言，对于向量 b 的某些值，有可能不存在解，或者存在无限多个解。存在多于一个解但是少于无限多个解的情况是不可能发生的；因为如果 x 和 y 都是某方程组的解，则z = αx + (1 − α)y。
一组向量的 生成子空间（span）是原始向量线性组合后所能抵达的点的集合。
确定 Ax = b 是否有解相当于确定向量 b 是否在 A 列向量的生成子空间中。这个特殊的生成子空间被称为 A 的 列空间（column space）或者 A 的 值域（range）。
一个列向量线性相关的方阵被称为 奇异的（singular）。
如果矩阵 A 不是一个方阵或者是一个奇异的方阵，该方程仍然可能有解。但是我们不能使用矩阵逆去求解。

范数是满足下列性质的任意函数：

当 p = 2 时， L² 范数被称为欧几里得范数（Euclidean norm）。它表示从原点
出发到向量 x 确定的点的欧几里得距离。

正如我们可以通过分解质因数来发现整数的一些内在性质，我们也可以通过分解矩阵来发现矩阵表示成数组元素时不明显的函数性质。
特征分解（eigendecomposition）是使用最广的矩阵分解之一，即我们将矩阵分解成一组特征向量和特征值。
方阵 A 的 特征向量（eigenvector）是指与 A 相乘后相当于对该向量进行缩放的非零向量 v：Av = λv。
如果 v 是 A 的特征向量，那么任何缩放后的向量 sv (s ∈ R，s ̸= 0) 也是 A 的特征向量。此外， sv 和 v 有相同的特征值。基于这个原因，通常我们只考虑单位特征向量。