高等数学
-
凹凸函数
-
对于函数f(x),如果对于任意的
x1
x
1
,
x2
x
2
,和
λ∈(0.1)
λ
∈
(
0.1
)
都满足
f(λx1+(1−λ)x2)<λf(x1)+(1−λ)f(x2) f ( λ x 1 + ( 1 − λ ) x 2 ) < λ f ( x 1 ) + ( 1 − λ ) f ( x 2 )
称为f(x)为凹函数。反之凸函数
极值
- 在函数某个域上取得最大值或者最小值的点的函数值称为极值。而这个点的横坐标成为极值点 中值定理
-
描述连续光滑曲线在两点之间的光滑性
令f(x)为光滑曲线,在其上取任意一点(a,f(a)),(b,f(b)), a < b,则必然存在一点c ,a < c < b,使得经过c点的切线斜率与经过a ,b两点的割线斜率相同 f(c)‘=f(b)−f(a)b−a f ( c ) ‘ = f ( b ) − f ( a ) b − a
罗尔中值定理
-
如果函数f(x)满足:
1. f(x)在闭区间 [ a,b ] 上连续
2. 在开区间 ( a,b) 上可导
3. f(a) = f(b)则在(a,b)中至少存在一点c ,使得 f(c)‘=0 f ( c ) ‘ = 0
拉格朗日中值定理
-
如果函数f(x)满足:
1. f(x)在闭区间 [ a,b ] 上连续
2. 在开区间 ( a,b) 上可导则必然存在一点c ,a < c < b,使得经过c点的切线斜率与经过a ,b两点的割线斜率相同 f(c)‘=f(b)−f(a)b−a f ( c ) ‘ = f ( b ) − f ( a ) b − a
柯西中值定理
-
如果函数f(x),g(x)都满足:
1. 在闭区间 [ a,b ] 上连续
2. 在开区间 ( a,b) 上可导则存在点 c∈(a,b) c ∈ ( a , b ) 使得 (f(b)−f(a))∗g(c)‘=(g(b)−g(a))∗f(c)‘ ( f ( b ) − f ( a ) ) ∗ g ( c ) ‘ = ( g ( b ) − g ( a ) ) ∗ f ( c ) ‘
泰勒级数
-
一个在实数或者复数a邻域无穷可微的函数 f(x) ,它的泰勒展开式如下
f(x)=∑∞n=0f(n)(a)n!f(x−a)n f ( x ) = ∑ n = 0 ∞ f ( n ) ( a ) n ! f ( x − a ) n
当a=0时,为 麦克劳林级数
无穷小量
- 给定一个数列An,对任意给定的正实数 ϵ ϵ ,都存在N使得 |ak|<ϵ | a k | < ϵ 在k > N 时必然成立 极限
- 当 x→c x → c 时 f(x)→L f ( x ) → L ,定义为对于任意的 ϵ>0 ϵ > 0 ,都存在一个 δ>0 δ > 0 ,若 |x−c|<δ | x − c | < δ 则 |f(x)−L|<ϵ | f ( x ) − L | < ϵ
线代
-
矩阵的初等变换
-
初等行变换
1. 互换矩阵两行的位置
2. 用一个不等于零的数乘以矩阵的某行所有元素
3. 将矩阵的某行的某个倍数加到另外一行
矩阵的初等行变换或者初等列变换后的矩阵都是等价的 。
奇异矩阵
- 行列式 det(A)=0 d e t ( A ) = 0 的矩阵 A为奇异矩阵,反之为非奇异矩阵 特征值和特征向量
-
对于给定的矩阵A,它的特征向量
v
v
是经过A线性变换的线性变换后得到的新向量仍然与 保持同一条直线上,它的长度可能会改变。即
Av=λv A v = λ v
-
其中
λ
λ
是标量,成为其特征值。矩阵A的特征值的数量等于它的秩。有多少个特征值,就有多少个特征向量。一般求特征值和特征向量的方法如下:
det(A−λI)=0 d e t ( A − λ I ) = 0
-
可以得到关于
λ
λ
的n次(n为矩阵A的维度)多项式,这个多项式的根就是所有的特征值,将特征值带入
(A−λI)x=0
(
A
−
λ
I
)
x
=
0
,解出
x
x
即得到这个特征值对应的特征向量。还有
幂法
来求特征值向量,不过求的是最大的特征向量,在主成分分析中(PCA)会用到 - 正交矩阵
- 矩阵Q满足 ,它作为一个变换矩阵可以保持距离不变,并且行列式为 ±1 ± 1 ,在 QR分解、奇异值分解中会用到。 等价矩阵
-
对于一个矩阵
A 如果矩阵B与A等价的话,则存在两个可逆矩阵P,Q使得
A=PBQ A = P B Q
相似矩阵
-
对于一个矩阵A,如果矩阵与矩阵A相似的话,则存在一个矩阵可逆矩阵P使得
A=PBP−1 A = P B P − 1
线性相关
- 如果有向量组 α1,α2...αn α 1 , α 2 . . . α n 是线性相关的,则存在不全为0 的 k1,k2,...kn k 1 , k 2 , . . . k n 使得 k1α1+k2α2+...knαn=0 k 1 α 1 + k 2 α 2 + . . . k n α n = 0 ;则称这个向量组是线性相关的 线性无关
- 如果有向量组 α1,α2...αn α 1 , α 2 . . . α n 是线性无关的,则如果 k1α1+k2α2+...knαn=0 k 1 α 1 + k 2 α 2 + . . . k n α n = 0 ,必然有 k1=k2=...=kn=0 k 1 = k 2 = . . . = k n = 0 格拉姆-施密特正交化
-
利用投影原理在已有的正交基上构建一个新的正交基假设
v∈Vn
v
∈
V
n
,并且
Vk
V
k
是
Vn
V
n
上的子空间,并且
v∉Vk
v
∉
V
k
,
Vk
V
k
的一组标准正交基{
η1,η2,..ηk
η
1
,
η
2
,
.
.
η
k
},
β=v−∑i=1kprojηiv β = v − ∑ i = 1 k p r o j η i v
则 β β 正交于 Vk V k 的正交基 ηi η i ,将 β β 正交化,则可以得到新的正交基
ηk+1=β||β|| η k + 1 = β | | β | |
那么{ η1,...ηk+1 η 1 , . . . η k + 1 }为 Vk V k 在v上扩展子空间span{ v,η1,...ηk v , η 1 , . . . η k }的标准正交基。
概率
-
简单随机事件
- 如果一个实验在相同条件下可以重复进行,但是结果不可实现预测,却呈现某种规律性,这种实验叫做 随机实验。
- 一个随机实验E可能发生也可能不发生的现象叫做这个随机实验的随机事件,它是 样本空间的一个子集。 条件概率
- P(A|B)=P(AB)P(B) P ( A | B ) = P ( A B ) P ( B ) 概率乘法公式
- P(ABC)=P(A)P(B|A)P(C|AB) P ( A B C ) = P ( A ) P ( B | A ) P ( C | A B ) 全概率公式
-
样本空间的划分,将样本空间划分成有穷或者无穷个不相交的随机事件
A1,...An
A
1
,
.
.
.
A
n
.
若 A1,...An A 1 , . . . A n 是样本空间 Ω Ω 的一组可列划分,则对于任意随机事件B
P(B)=∑i=1nP(Ai)P(B|Ai) P ( B ) = ∑ i = 1 n P ( A i ) P ( B | A i )
贝叶斯公式
-
若
A1,...An
A
1
,
.
.
.
A
n
是样本空间
Ω
Ω
的一组可列划分,则
P(Ai|B)=P(Ai)P(B|Ai)∑ni=1P(Ai)P(B|Ai) P ( A i | B ) = P ( A i ) P ( B | A i ) ∑ i = 1 n P ( A i ) P ( B | A i )
边缘分布
-
假定一个于两个变量相关的概率分布
P(x,y)
P
(
x
,
y
)
,那么关于其中一个变量的边缘分布等于给定其它变量的条件概率分布:
P(x)=∑yP(x,y)=∑yP(x|y)P(y) P ( x ) = ∑ y P ( x , y ) = ∑ y P ( x | y ) P ( y )
随机变量
- 对于一个随机实验E,它的每个实验结果 ω∈Ω ω ∈ Ω ,有唯一的实数 X(ω) X ( ω ) 与之对应,称 X(ω) X ( ω ) 为随机实验E的随机变量 分布函数
-
X是一个随机变量,x是一个实数
F(x)=P(X≤x) F ( x ) = P ( X ≤ x )
F(x)为概率分布
概率密度函数
-
F(x)=∫x−∞f(x)dx F ( x ) = ∫ − ∞ x f ( x ) d x
f(x)为概率密度函数
随机变量的独立性
-
设随机向量(X,Y)的联合分布函数为F(x,y),
Fx(X)
F
x
(
X
)
,
Fy(Y)
F
y
(
Y
)
分别为X,Y的分布函数,若对于一切
(x,y)∈R2
(
x
,
y
)
∈
R
2
,都有
F(x,y)=Fx(x)Fy(y) F ( x , y ) = F x ( x ) F y ( y )
则说明随机变量X,Y相互独立
数学期望
-
随机变量X的分布律为
P(X=xk)=pk,k=1,2,...
P
(
X
=
x
k
)
=
p
k
,
k
=
1
,
2
,
.
.
.
,若级数
∑k=1∞|xk|pk ∑ k = 1 ∞ | x k | p k
收敛,则随机变量X存在数学期望 EX=∑∞k=1xkpk E X = ∑ k = 1 ∞ x k p k 。如果是概率密度函数,则 EX=∫∞−∞xf(x)dx E X = ∫ − ∞ ∞ x f ( x ) d x
方差
- 设X是一个随机变量,若 (X−EX)2 ( X − E X ) 2 的数学期望存在,则称 E(X−EX)2 E ( X − E X ) 2 为X的方差DX,表达了随机变量X与期望的偏离程度, DX−−−√ D X 为标准差 σ(x) σ ( x ) 协方差与相关系数
-
反映随机变量X,Y的关系,如果X,Y相互独立,则
E(X−EX)E(Y−EY)=0
E
(
X
−
E
X
)
E
(
Y
−
E
Y
)
=
0
,称其为随机变量X,Y的协方差
Cov(X,Y)=E(X−EX)E(Y−EY) C o v ( X , Y ) = E ( X − E X ) E ( Y − E Y )
称ρxy=Cov(X,Y)DXDY−−−−−−√ ρ x y = C o v ( X , Y ) D X D Y
为X,Y的相关系数.