ccc-机器学习数学基础

扔出去的回旋镖

已于 2022-09-06 21:00:09 修改

阅读量156

点赞数

分类专栏：机器学习数学基础文章标签：机器学习算法人工智能

于 2022-09-06 20:59:57 首次发布

本文链接：https://blog.csdn.net/liubi32326/article/details/126711618

版权

机器学习数学基础专栏收录该内容

3 篇文章 0 订阅

订阅专栏

偏向于理解，不涉及证明

Hello world：

代码：

import sympy as sp
sp.init_printing()
sym_x , sym_y , sym_z = sp.symbols("x y z")
sp.diff(sym_x **3 - sym_x *3)

也可以简单一点：

str_expr = "x ** 3 -x * 3"
expr = sp.sympify(str_expr)
sp.diff(expr)

结果：
在这里插入图片描述

1.链式求导

$h'(x)=f'(g(x))g'(x)$
等效
$h'=(f\circ g)'=(f'\circ g)\cdot g'$
莱布尼茨的符号表示
${\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}} 或者{\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x}$
多变量函数的导数
${\frac {\partial ^{2}y}{\partial x_{i}\partial x_{j}}}=\sum _{k}\left({\frac {\partial y}{\partial u_{k}}}{\frac {\partial ^{2}u_{k}}{\partial x_{i}\partial x_{j}}}\right)+\sum _{{k,\ell }}\left({\frac {\partial ^{2}y}{\partial u_{k}\partial u_{\ell }}}{\frac {\partial u_{k}}{\partial x_{i}}}{\frac {\partial u_{\ell }}{\partial x_{j}}}\right)$

2.费马定理

定理定义：设函数f(x)在点x0的某邻域U(x0)内有定义，并且在x0处可导，如果对任意的x∈U(x0)，有f(x)≤f(x0)(或f(x)≥f(xo))，那么f’(x0)=0

解释：一段区间内的极值点如果它可导那么其导数一定等于0。反之不成立

3.泰勒展开

$f(a)+{\frac {f'(a)}{1!}}(x-a)+{\frac {f''(a)}{2!}}(x-a)^{2}+{\frac {f'''(a)}{3!}}(x-a)^{3}+\cdots$

4.凸函数

典型凸函数的形状类似于字母U。严格凸函数只有一个局部最低点，该点也是全局最低点。经典的 U 形函数都是严格凸函数。

5.偏导数

是一个比较基础的性质，反应函数沿轴的正方向的变化率。偏导存在不一定连续，连续也不一定偏导；可微一定连续，偏导一定存在；偏导连续则函数一定连续也一定可微。

6.方向导数

反应的是函数y在某一点X₀处沿着特定方向（不一定是轴正方向）的变化率。

7.可微函数

可微函数是平滑的（该函数在每个内部点处局部很好地近似为线性函数）并且不包含任何中断、角度或尖点。一般情况会利用偏导连续来证明可微。

8.梯度

一个函数沿各方向上的变化率，经常用来通过梯度上升来最大化函数。
雅可比矩阵（Jacobian）：多个变量的向量值函数的一阶偏导数的矩阵
$\mathbf {J} ={\begin{bmatrix}{\dfrac {\partial \mathbf {f} }{\partial x_{1}}}&\cdots &{\dfrac {\partial \mathbf {f} }{\partial x_{n}}}\end{bmatrix}}={\begin{bmatrix}\nabla ^{\mathsf {T}}f_{1}\\\vdots \\\nabla ^{\mathsf {T}}f_{m}\end{bmatrix}}={\begin{bmatrix}{\dfrac {\partial f_{1}}{\partial x_{1}}}&\cdots &{\dfrac {\partial f_{1}}{\partial x_{n}}}\\\vdots &\ddots &\vdots \\{\dfrac {\partial f_{m}}{\partial x_{1}}}&\cdots &{\dfrac {\partial f_{m}}{\partial x_{n}}}\end{bmatrix}}$

9.黑森矩阵（Hessian_matrix）：

如果实多元函数的所有的二阶偏导数存在，则有
$\mathbf {H} _{f}={\begin{bmatrix}{\dfrac {\partial ^{2}f}{\partial x_{1}^{2}}}&{\dfrac {\partial ^{2}f}{\partial x_{1}\,\partial x_{2}}}&\cdots &{\dfrac {\partial ^{2}f}{\partial x_{1}\,\partial x_{n}}}\\[2.2ex]{\dfrac {\partial ^{2}f}{\partial x_{2}\,\partial x_{1}}}&{\dfrac {\partial ^{2}f}{\partial x_{2}^{2}}}&\cdots &{\dfrac {\partial ^{2}f}{\partial x_{2}\,\partial x_{n}}}\\[2.2ex]\vdots &\vdots &\ddots &\vdots \\[2.2ex]{\dfrac {\partial ^{2}f}{\partial x_{n}\,\partial x_{1}}}&{\dfrac {\partial ^{2}f}{\partial x_{n}\,\partial x_{2}}}&\cdots &{\dfrac {\partial ^{2}f}{\partial x_{n}^{2}}}\end{bmatrix}},$
该矩阵描述多变量的函数的局部曲率