机器学习中的数学
文章平均质量分 79
HawardScut
工作啦,有时比较忙没及时回复,望见谅。
展开
-
(一)向量求导
举例:y=2xTxy=2xTx y=2x^Tx(xxx是向量,yyy是函数值)假设x=(x1,x2,x3)x=(x1,x2,x3)x=(x_{1},x_{2},x_{3}),则 y=2(x1,x2,x3)⎛⎝⎜x1x2x3⎞⎠⎟=2(x21+x22+x23)y=2(x1,x2,x3)(x1x2x3)=2(x12+x22+x32)y=2(x_{1},x_{2},x_{3})\begin{p...原创 2018-05-14 11:57:32 · 1112 阅读 · 2 评论 -
(二)实值函数相对于向量的梯度
1、定义以n维向量xxx为变元的实标量函数f(x)f(x)f(x)相对于xxx的梯度结果为n*1列向量,定义为▽xf(x)=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢∂f(x)∂x1∂f(x)∂x2⋮∂f(x)∂xn⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥=[∂f(x)∂x1,∂f(x)∂x2,...,∂f(x)∂xn]T=∂f(x)∂x▽xf(x)=[∂f(x)∂x1∂f(x)∂x2⋮∂f(x)∂xn]=[∂f(x)∂x1,...原创 2018-05-15 19:09:01 · 7205 阅读 · 0 评论 -
(三)随机变量
1、分布函数随机变量XXX是离散的,XXX取值1,2,3…2、累积分布函数随机变量XXX是连续的,XXX取值在某一个范围,所以需要累积。 累积分布函数数学描述: FX(x)=P(X⩽x)FX(x)=P(X⩽x)F_{X}(x)=P(X\leqslant x)P(a<X<b)=FX(b)−FX(a)P(a<X<b)=FX(b)−FX(a)P(afX(x...原创 2018-05-22 10:52:41 · 398 阅读 · 0 评论 -
(四)高斯分布(正态分布)
1、一元概率密度f(x|μ,σ2)=1σ2π−−√e−(x−μ)22σ2f(x|μ,σ2)=1σ2πe−(x−μ)22σ2f(x|\mu ,\sigma ^2)=\frac{1}{\sigma\sqrt{2\pi }}e^{-\frac{(x-\mu)^2 }{2\sigma ^2}}其中,xxx是随机变量,μμ\mu是均值,σσ\sigma是标准差,σ2σ2\sigma^2是方差。当...原创 2018-05-22 11:41:05 · 3536 阅读 · 0 评论 -
(五)矩阵
1、方阵的特征值与特征向量如果满足Ax=λxAx=λxAx=\lambda x ,其中AAA是方阵,λλ\lambda是标量值,xxx是向量;则称λλ\lambda是方阵的特征值,xxx是方阵的特征向量。AxAxAx的集合意义是对向量xxx进行旋转和伸缩变换,如下图 假如A=[4114]A=[4114]A=\begin{bmatrix}4&1\\ 1&4\end{bmatrix} ...原创 2018-05-22 18:28:45 · 287 阅读 · 0 评论 -
(六)特征分解的运用
1、PCA的本质协方差矩阵的相似对角化,KL变换给定一个矩阵X∈Rm×nX∈Rm×nX\in R^{m\times n},例如 X=[a1b1a2b2⋯⋯anbn](1)X=[a1a2⋯anb1b2⋯bn](1)X=\begin{bmatrix}a_1 &a_2 &\cdots &a_n \\ b_1 &b_2 &\cdots & b_n原创 2018-05-23 11:28:14 · 1283 阅读 · 0 评论