python 计算置信区间_从样本数据计算置信区间

最新推荐文章于 2023-05-26 23:48:47 发布

yisac

最新推荐文章于 2023-05-26 23:48:47 发布

阅读量3.6k

点赞数 1

文章标签： python 计算置信区间

本文链接：https://blog.csdn.net/weixin_31842821/article/details/114922780

版权

这里是shasan代码的缩写版本，计算数组a的平均值的95％置信区间：

import numpy as np, scipy.stats as st st.t.interval(0.95, len(a)-1, loc=np.mean(a), scale=st.sem(a))

但使用StatsModels的tconfint_mean可以说更好：

import statsmodels.stats.api as sms sms.DescrStatsW(a).tconfint_mean()

两者的基本假设是样本(数组a )独立于标准差未知的正态分布(参见MathWorld或Wikipedia )。

对于大样本量n，样本均值是正态分布的，可以使用st.norm.interval()来计算置信区间(如Jaime的评论中所build议的)。但是，对于小的n，上面的解决scheme也是正确的，其中st.norm.interval()给出了太窄的置信区间(即“假置信度”)。有关更多详细信息，请参阅我对类似问题的回答 (以及Russ在此处的评论之一)。

这里是一个例子，其中正确的选项给出(基本上)相同的置信区间：

In [9]: a = range(10,14) In [10]: mean_confidence_interval(a) Out[10]: (11.5, 9.4457397432391215, 13.554260256760879) In [11]: st.t.interval(0.95, len(a)-1, loc=np.mean(a), scale=st.sem(a)) Out[11]: (9.4457397432391215, 13.554260256760879) In [12]: sms.DescrStatsW(a).tconfint_mean() Out[12]: (9.4457397432391197, 13.55426025676088)

最后，使用st.norm.interval()的错误结果是：

In [13]: st.norm.interval(0.95, loc=np.mean(a), scale=st.sem(a)) Out[13]: (10.23484868811834, 12.76515131188166)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yisac

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

用Python 计算t分布的置信区间

xupeggy163的博客

07-28

2121

用python 计算t分布置信区间的步骤

python 散点图 置信区间_python 置信区间

weixin_33195817的博客

02-19

2373

置信区间是指由样本统计量所构造的总体参数的估计区间。这句话也就是说 ( 这里统计量一般指均值 ) 利用样本均值来估计总体均值的可靠程度, 这个"可靠程度"用"置信区间"来表示, 置信区间(是一个系数)取值范围为: 0 当样本量越大, 则越可靠.置信区间计算公式:ci = mean±stdN(ppf)( (1-α)/2 )公式参数说明:ci: 表示置信区间mean: 表示样本均值std: 表示样...

参与评论您还未登录，请先登录后发表或查看评论

Python统计学04——参数估计

weixin_46277779的博客

09-04

2288

Python计算总体均值方差的区间估计，还有两个总体的的均值差和方差比的区间估计

python：根据样本数据计算置信区间

平平淡淡，戒急用忍，一生学闭嘴。

11-22

2789

import numpy as np import scipy.stats def mean_confidence_interval(data, confidence=0.95): a = 1.0 * np.array(data) n = len(a) m, se = np.mean(a), scipy.stats.sem(a) h = se * scipy.stats.t.ppf((1 + confidence) / 2., n-1) return m, m-h

Python笔记-置信区间含义及运算

IT1995的博客

02-14

9502

基本概念这里先要知道几个概念！均值（平均值）：一组数据的平均值，比如学生时代最喜欢的平均分；方差：一组数据与平均值的偏离程度；标准差（标准误差）：方差开根号，反应数据的离散程度； 置信区间：统计的数据误差范围，所以有个上下值，比如农产品上写的5kg±5%。置信水平：让人相信的概率，比如置信水平是95%，如100个数据，有95个数据在上面的置信区间上。计算置信区间 ①求均值； ②求标准误差； ③查表的z值，如下表：置信水平 |z|值 90% 1.64

python 计算置信区间,Python求解正态分布置信区间

weixin_39850143的博客

03-25

2097

Python求解正态分布置信区间正态分布和置信区间正态分布(Normal Distribution)又叫高斯分布，是一种非常重要的概率分布。其概率密度函数的数学表达如下：$$f(x) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x - \mu)^2}{2\sigma^2}}$$当$\mu=0$，$\sigma = 1$时，称为标准正太分布。置信区间是对该区间...

python计算方差的置信区间_python计算置信区间

weixin_39645019的博客

12-04

1912

python 置信区间置信区间是指由样本统计量所构造的总体参数的估计区间。这句话也就是说 ( 这里统计量一般指均值 ) 利用样本均值来估计总体均值的可靠程度, 这个"可靠程度"用"置信区间"来表示, 置信区间(是一个系数)取值范围为: 0当样本量越大, 则越可靠.置信区间计算公式:ci = mean±stdN(ppf)( (1-α)/2 )公式参数说明:ci: 表示置信区间mean: 表示样本...

python 散点图 置信区间_python计算置信区间

weixin_39774219的博客

12-04

1330

python 置信区间_关于置信区间的完整指南和Python示例

weixin_26737625的博客

09-09

1万+

python 置信区间Confidence Interval (CI) is essential in statistics and very important for data scientists. In this article, I will explain it thoroughly with necessary formulas and also demonstrate how to...

python 计算置信区间,计算置信区间(示例代码)

weixin_33242795的博客

03-25

3903

proc freq data=datain;by group;tables var / missprint nowarn binomial(level=‘1‘ cl=exact ) alpha=0.05;weight n/zero;(对发生的做置信区间，考虑发生数量为0的情况)ods output binomialcls=cl;run;ods output close;datain的格式如下：gr...

求AUC 95%置信区间

的博客

01-12

5458

求AUC 95%置信区间 直接上代码。 def bootstrap_auc(y, pred, classes, bootstraps = 100, fold_size = 1000): statistics = np.zeros((len(classes), bootstraps)) for c in range(len(classes)): df = pd.DataFrame(columns=['y', 'pred']) # df. df

二项分布比例的置信区间计算