从零开始：机器学习的数学原理和算法实践--学习笔记（1）

cc_wangxin

已于 2022-12-07 18:10:48 修改

阅读量439

点赞数

文章标签：矩阵概率论线性代数

于 2022-12-07 17:47:04 首次发布

本文链接：https://blog.csdn.net/weixin_45752264/article/details/128224314

版权

梯度

梯度：多元函数对各个自变量求偏导形成的向量

泰勒公式

$\frac{f(a)}{0!} + \frac{f^1(a)}{1!}*(x-a) + \frac{f^2(a)}{2!}*(x - a)^2+ \frac{f^3(a)}{3!} * (x-a)^3 + ... + R_n(x)$
此公式为 $f (x)$ 在点a处的泰勒级数

泰勒公式的主要作用是对特别复杂的函数进行化简，具体来说就是通过近似函数来代替原函数，通过使用简单熟悉的多项式去替代复杂的原函数

基向量与线性无关

线性无关： 线性无关的一组向量中任意一个向量都不能由其他向量所表示；由一组向量的线性组合得到零向量只能通过所有系数为0这种方式实现，那么这组向量就是线性无关的，反之就是线性相关的。

矩阵向量乘法描述线性变换： 矩阵向量乘法描述的是线性空间中的一种线性变换，原始向量所对应的线性变换作用下空间位置甚至空间维度和形态都发生了改变，这就是矩阵的空间映射作用；矩阵 $A$ 与列向量 $X$ 的乘积 $A X$ 就等于将原始列向量 $X$ 的默认基向量分别对应地变换为矩阵 $A$ 的各列，由矩阵 $A$ 的各列作为目标向量的新基向量。
矩阵 == 线性变换

最小二乘法

最小二乘法中的二乘代表平方的意义，最小二乘代表平方和最小，具体指测量值与真实值之间的误差平方最小化，即各个点的横坐标对应的原始点纵坐标与直线上拟合点纵坐标误差的平方和最小化，
$\sqrt{(b_1 - q_1)^2 + (b_2 - q_2)^2+ ... +(b_n - q_n)^2}$
其中向量 $b$ 代表原始点的纵坐标， $q$ 代表拟合点的纵坐标， $P$ 为投影矩阵
$函数名=\begin{cases} \hat{x} = (A^TA)^{-1}Ab \\ p = A(A^TA)^{-1}Ab \\ P = A(A^TA)^{-1}A \end{cases}$