文章目录
1、概率与积分
(1)离散随机变量
(2)连续随机变量
(3)如何理解概率
1)事件的概率
- 整个概率空间是一个事件,这个事件一定发生所以全空间的概率为 1 1 1。
- 事件 是随机变量值域的子集 S S S。
- 事件的概率 表示 S S S 里面概率之和或概率密度之积分。
2)事件的条件概率
- 条件也是事件,也可以表示为随机变量值域的子集: A A A
- 条件概率里面的事件,又是这个条件的子集: S ∩ A ⊂ A S \cap A \subset A S∩A⊂A
- 事件的条件概率则表示为 S ∩ A S \cap A S∩A 在 A A A里面所占的比例。 P ( S ∣ A ) = P ( S ∩ A ) P ( A ) P(S|A) = \frac{P(S \cap A)}{P(A)} P(S∣A)=P(A)P(S∩A)
2、条件概率与贝叶斯公式
3、大数定律与中心极限定理
3.1 随机变量的矩
3.2 大数定律
3.3 中心极限定理【正态分布】
4、矩估计与极大似然估计
4.1 参数估计
4.2 矩估计
4.3 极大似然估计
- 给定随机变量的分布与未知参数,利用观测到的样本计算似然函数
- 选择最大化似然函数的参数作为参数估计量。【对未知参数的估计】
应用举例:正态分布的参数估计
X X X 服从参数为 θ = ( μ , σ ) \theta = (\mu, \sigma) θ=(μ,σ)的正态分布,独立重复实验 n n n 次得到样本, X 1 , . . . , X n X_1, ... , X_n X1,...,Xn. 请利用极大似然估计来估计参数 θ \theta θ。
L ( μ , σ ) = ∏ i = 1 n 1 2 π σ e x p ( − ( x i − μ ) 2 2 σ 2 ) L(\mu, \sigma) = \prod_{i=1}^n {\frac{1}{\sqrt{2 \pi} \sigma} exp(- \frac{(x_i - \mu)^2}{2 \sigma^2})} L(μ,σ)=i=1∏n2πσ1exp(−2σ2(xi−μ)2)
l ( μ , σ ) = l n ( L ( μ , σ ) ) = l n ( ∏ i = 1 n 1 2 π σ e x p ( − ( x i − μ ) 2 2 σ 2 ) ) l(\mu, \sigma) = ln(L(\mu, \sigma)) = ln(\prod_{i=1}^n \frac{1}{\sqrt{2 \pi} \sigma} exp(- \frac{(x_i - \mu)^2}{2 \sigma^2})) l(μ,σ)=ln(L(μ,σ))=ln(i=1∏n2πσ1exp(−2σ2(xi−μ)2))
l ( μ , σ ) = ∑ i = 1 n ( l n ( 1 2 π σ ) + l n ( e x p ( − ( x i − μ ) 2 2 σ 2 ) ) ) l(\mu, \sigma) = \sum_{i=1}^n(ln(\frac{1}{\sqrt{2 \pi}\sigma} ) + ln(exp(- \frac{(x_i - \mu)^2}{2 \sigma^2})) ) l(μ,σ)=i=1∑n(ln(2πσ1)+ln(exp(−2σ2(xi−μ)2)))
l
(
μ
,
σ
)
=
∑
i
=
1
n
(
0
−
l
n
(
2
π
)
−
l
n
(
σ
)
+
(
−
(
x
i
−
μ
)
2
2
σ
2
)
)
)
l(\mu, \sigma) = \sum_{i=1}^n(0 - ln(\sqrt{2 \pi}) - ln(\sigma) + (- \frac{(x_i - \mu)^2}{2 \sigma^2})) )
l(μ,σ)=i=1∑n(0−ln(2π)−ln(σ)+(−2σ2(xi−μ)2)))
所以:
l
(
μ
,
σ
)
=
C
−
n
2
l
n
(
σ
2
)
−
1
2
σ
2
∑
i
=
1
n
(
x
i
−
μ
)
2
l(\mu, \sigma) = C - \frac{n}{2}ln(\sigma^2)- \frac{1}{2 \sigma^2} \sum_{i=1}^n(x_i -\mu)^2
l(μ,σ)=C−2nln(σ2)−2σ21i=1∑n(xi−μ)2
然后似然方程为
∂
l
∂
σ
=
∂
l
∂
μ
=
0
\frac{\partial l}{\partial \sigma} = \frac{\partial l}{\partial \mu} = 0
∂σ∂l=∂μ∂l=0,也就是
μ
=
1
n
∑
i
=
1
n
x
i
\mu = \frac{1}{n} \sum_{i=1}^n x_i
μ=n1i=1∑nxi
σ
2
=
1
n
∑
i
=
1
n
(
x
i
−
μ
)
2
\sigma^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2
σ2=n1i=1∑n(xi−μ)2
最后计算得到极大似然估计量:
μ
=
X
‾
\mu = \overline{X}
μ=X
σ
^
2
=
1
n
∑
i
=
1
n
(
x
i
−
X
‾
)
2
\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \overline{X})^2
σ^2=n1i=1∑n(xi−X)2
4.4 点估计的评判标准
- 相合性:当样本数量趋于无穷时,估计量收敛于参数真实值。
- 无偏性:对于有限的样本,估计量所符合的分布之期望等于参数真实值。
- 有效性:估计值所满足的分布方差越小越好。
- 渐进正态性:当样本趋于无穷时,去中心化去量纲化的估计量符合标准正态分布。