置信区间、置信水平、边际误差

最新推荐文章于 2025-04-20 04:16:21 发布

五道口纳什

最新推荐文章于 2025-04-20 04:16:21 发布

阅读量3.4w

点赞数 6

分类专栏：概率-统计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanchunhui/article/details/51753336

版权

概率-统计专栏收录该内容

74 篇文章

订阅专栏

假设

真实比例为 $p$ ，取值范围为 $0\sim 1$ ，
观测到的比例（如抽样）的比例为 $\hat p$ （在统计理论中通常使用“帽子”也标志某数据的估值）
边际误差为 $\epsilon$

所要求解的问题是：真实的比例 $p$ 落在置信区间 $\left[\hat p-\epsilon, \hat p+\epsilon\right]$ 的概率。

落在置信区间的标准通用采用 95%，这一数字被称为置信水平，表达我们对 $p$ 成功落入区间的信息程度。

区间公式通过以下求解：

p = p^\pm 1.96 \times p ^ ( 1 - p ^ ) n - - - - - - - - \sqrt = p^\pm ϵ

$p=\hat p\pm 1.96\times \sqrt{\frac{\hat p\left(1-\hat p\right)}{n}}=\hat p\pm \epsilon$

也可根据边际误差推测样本容量
$n$ 表示样本中的个体数量
公式表示未知的真实比例 $p$ 有 95% 的概率落入 $\hat p\pm \epsilon$ ，也就是说，每 20 个这样的区间，平均有 19 个区间中有 $p$ ，只有 1 个不在区间中。

值得注意的是，边际误差 $\epsilon$ 会随着样本容量的增加而减小，因此，访问的民众越多，民调就越可信。

95 % \Rightarrow 1.96 99 % \Rightarrow 2.58

$95\%\Rightarrow 1.96\\ 99\%\Rightarrow 2.58$

来看一个具体的示例，对 1000 人进行民调，有 400 人支持总统。 $\hat p=0.4$ ， $n=1000$ ，将其带入公式，置信区间就变为：

p = p^\pm 1.96 p ^ ( 1 - p ^ ) n - - - - - - - - \sqrt = 0.4 \pm 0.03

$p=\hat p\pm 1.96\sqrt{\frac{\hat p\left(1-\hat p\right)}{n}}=0.4\pm0.03$

许多民调的边际误差都保持在 3% 左右，这并非巧合。置信水平为 95%，则系数为 1.96，如果观测比例 $\hat p$ 与 0.5 接近，比如在 0.3 和 0.7 之间， $\hat p\left(1-\hat p\right)$ 的平方根大约为 0.5。而 1.96 约等于 2，两者相乘的结果大概是 1，边际误差就约为 $\frac1{\sqrt {n}}$ ：

ϵ = 1 n - - \sqrt

$\epsilon=\frac1{\sqrt n}$
假设样本容量约为典型的 1000，边际误差就是 3%（

11000√≈0.03 $\frac1{\sqrt{1000}}\approx 0.03$ ）.

1. 具有欺骗性质的统计数据

如果在一项民调中，50.5%的人表达了对加入欧盟的支持。也即为了得出此结论，必须将边际误差降到 0.5%（下界不会跌破 50%），导致置信水平只有 25%.

这里的样本人数仍为 1000，则置信水平在 0.25 时的 Z 为 0.32，则其边际误差为：

0.32 \cdot 0.5 1000 - - - - \sqrt \approx 0.005

$0.32\cdot \frac{0.5}{\sqrt {1000}}\approx 0.005$

另一个没有代表性的样本例子是假设你在你家附近做晚间散步，发现你看到的 20 人里有 14 个人都在遛狗，可以得出 70% 的邻居都养狗了吗？

1.96 \times 0.7 \times 0.3 20 - - - - - - - - \sqrt \approx 0.2008

$1.96\times \sqrt{\frac{0.7\times 0.3}{20}}\approx 0.2008$

再来看一个典型的案例，2005 年秋天，媒体报道小布什总统的支持率首次跌破 40%（好像这个 40% 是一个十分精确的数值一样）。从某种程度上是毫无意义的声明。虽然（抽样调查的）事实可能是前次民调显示支持率为 41%，下次结果则为 39%，这些数字的边际误差都是 3%，若建立其相关的置信区间，在部分区间上数值是重复的。没有边际误差的 41% 和 39% 不能说明一切，只有被我们表述为区间 [38, 44]（41%），[36, 42]（39%）时才有意义。不仅如此，我们也不能排除两次民调间支持率其实是存在上升的情况。

只有当差异大到完全超过边际误差（区间没有重叠）时，才能被称为具有统计显著性。

五道口纳什

博客等级

码龄14年

3595
原创

3969
点赞

9531
收藏

7436
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

[Math Processing Error] 问题的解决（F5刷新页面与 Ctrl/Shift + F5 刷新页面的区别）
qq_46380278: 有的能解决有的网站好像也没用
[Math Processing Error] 问题的解决（F5刷新页面与 Ctrl/Shift + F5 刷新页面的区别）
2301_81505543: 还有没有其他方法啊，ctrl+f5不刷新，ctrl+R刷新了，但没有，急死了
音频、视频等文件格式（.ts、.meta）及其认识
Shuuc: meta 文件并不能打开
补码：统一加减运算
做而论道_CS: 虽然，计算机使用的是：二进制数。但是，进行算术计算时，二进制数也是数，与十进制是雷同的。二进制数，也是数，它也是完全正常的数字。并非是什么乱七八糟的：原码反码补码。千万不要听信那些砖家胡讲！就说四位二进制数吧。四位数范围是：0000 ~ 1111。相当于十进制：0 ~ 15。出现进位，即：2^4 = 16。这些数中，既没有小数点，也没有符号位。它们，都是正整数！计算机砖家就给它们编造了一个名称：无符号数。其实，这就是【忽悠】！计算机中有个加法器，其运算规则是：逢二进一。找两个无符号数相加，列竖式如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 －－－－－－－－－－－进 1、 0 1 0 0　= 16 + 4 = 20 这就是 “无符号数” 的加法：　　5 + 15 = 16 + 4 = 20。计算完全正确！－－－－－－－－－－－－－－－－－但是，如果你忽略了进位呢？（或者说：故意舍弃了进位。）这就少算了 16 ！那么就是：5 + 15－16 = 5－1 = 4。此时的＋15，就相当于－1 了！为什么是－1 ？因为你：舍弃了进位，少算了 16。所以有：＋15－16 = －1。加法的竖式，依然如下：　　　0 1 0 1　= 5 　　＋1 1 1 1　= 15 （=－1）－－－－－－－－－－－略掉、0 1 0 0　= 4 但是，此时，这可就是【减法运算】了。你看吧，本来是两个 “无符号数” 相加，丢了进位，就变成了 “有符号数” 相减！由此可知，所谓的 “有符号数、无符号数、符号位”，就是瞎掰！二进制数，也就是普通的数字！只是因为： “弄丢了进位”，才会出来 “负数” 和 “减法”。
matplotlib tricks（关闭坐标刻度、坐标轴不可见）
qq_37404964: set_xticklabels([])是可以的

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

五道口纳什 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。