数学基础系列文章目录
什么是置信区间、置信度
统计学有个核心思想就是用样本估计总体
一般地,用到置信度这个概念是为了求得真值,而真值就是我们只能估计的总体参数;我们取得数据是样本数据,点估计就是样本参数的真实值。
如图,假设在样本数目不变的情况下,做了一百次实验,其中有95个置信区间包含了总体真值,则置信度为95%。其中大虚线表示为总体参数真值,是不知道且想要估计的值,因为100个置信区间中有95个置信区间包含了真实值,所以当我们只做一次置信区间时,我们认为这个区间是可信的,并有95%的概率认为该区间包含了总体参数真实值。
举例,进行射击测试,得到分数的均值
X
‾
\overline{X}
X是8,但是我们不能说均值就是总体期望
μ
\mu
μ,但我们可以说总体期望可能在8附近,如果均值和总体期望做差的话,应该会小于某个小的值∆,即
∣
X
‾
−
μ
∣
<
∆
|\overline{X} - \mu| <∆
∣X−μ∣<∆,在这里将不等式展开便可以得到总体期望的置信区间;而置信度指的是,均值与总体期望的差值小于这个给定值的概率为1-α,即
P
(
∣
X
‾
−
μ
∣
<
∆
)
=
1
−
α
P(|\overline{X} - \mu| < ∆) = 1 - \alpha
P(∣X−μ∣<∆)=1−α,换句话说,我们有1-α的信心认为,这个均值已经很总体期望很接近了。