频率推断
- 中心极限定理Central Limit Theorem(CLT)
独立同分布的随机变量X,若期望和方差都存在, E(Xi)=μ , D(Xi)=σ2 则N个(N很大)独立同分布的随机变量的和近似服从正态分布,即 ∑ni=1Xi∼N(nμ,nσ2) 或 ∑ni=1Xin∼N(μ,σ2n√) - 置信区间Confidence Intervals(CI)
参数点估计的近似正态分布的置信区间计算:
pointestimate±z∗×SE , SE 是标准误差,standard error.
z∗ 是标准正态分布中能够占据中间 X% 数据截断点, X% 是我们想要的置信水平。
对于均值来说, x¯±z∗sn√ 。 - 似然函数和最大似然估计
给定观测变量x,关于待估计参数 θ 似然函数 L(θ|y)=P(X=x|θ) ,在数值上等于给定参数θ后变量X=x的概率。
最大似然估计是求得是的似然函数最大的参数 θ ,即使得的数据和我们已经观测到的数据最相似的 θ 。
MLE θ=argmaxL(θ|y)