概率论 | 事件的关系与运算 |
条件概率,全概率公式,贝叶斯公式 | |
随机变量的期望,方差 | |
协方差,相关系数,协方差矩阵 | |
概率分布:0-1分布,二项分布,高斯分布 | |
极大似然函数估计 | |
大数定律,伯努利大数定律,中心极限定理 |
概率密度函数围城面积为1
1、常见分布
2、条件概率、全概率、贝叶斯
1)定义
进一步理解贝叶斯公式和后验概率。
3、协方差、相关系数
1)协方差,相关系数
2)协方差阵
3)独立、不相关
独立:
P
(
X
Y
)
=
P
(
X
)
P
(
Y
)
P(XY)=P(X)P(Y)
P(XY)=P(X)P(Y)
不相关:
C
o
v
(
X
,
Y
)
=
0
Cov(X,Y)=0
Cov(X,Y)=0
4、切比雪夫不等式、大数定律、中心极限定理
1)切比雪夫不等式
2)伯努利大数定理
进行n次独立重复试验,事件发生的频率近似于数学期望。
3) 中心极限定理
参考以前我写的中心极限定理
5、本福特定律
本福特定律说明一堆从实际生活得出的数据中, 以1为首位数字的数的出现概率约为总数的三成 ,接近直觉得出之期望值1/9的3倍。推广来说,越大的数,以它为首几位的数出现的概率就越低。它可用于检查各种数据是否有造假。
6、Sigmoid函数
f
(
x
)
=
1
1
+
e
−
x
f(x)=\frac{1}{1+e^{-x}}
f(x)=1+e−x1
f
′
(
x
)
=
f
(
x
)
(
1
−
f
(
x
)
)
f'(x)=f(x)(1-f(x))
f′(x)=f(x)(1−f(x))
sigmoid函数的实质是一个概率分布函数。
7、最大似然估计
使样本发生概率最大时求取参数 θ \theta θ,叫做极大似然估计。
步骤:
-
写似然函数(联合概率分布函数), L ( x 1 , x 2 , . . . x n ; θ ) L(x_1,x_2,...x_n;\theta) L(x1,x2,...xn;θ)
-
求对数
-
求导,令导数为0,得到似然解
- 例:高斯分布估计 μ \mu μ和 δ 2 \delta^2 δ2