统计学学习周-Datawhale

任务 2
【任务内容】
学习内容 :35-46集 中心极限定理、置信区间
35中心极限定理(the central limit theorem)
掷骰子离散概率分布 均值频率
sample size of n=4 【1,1,3,6】x_bar = 2.75
【3,4,3,1】x_bar = 2.75
【1,1,6,6】x_bar = 3.5
……
样本:来自分布总体的一系列样本值
样本容量:从分布中抽取了多少个样本值
任一均值为,方差为的分布,样本容量(sample size 5,10,20……无穷)足够大,无限次求出样本均值都能描绘均值频率分布图,能得到正态分布的很好近似
36样本均值的抽样分布(the sampling distribution of the sample mean ):即所有的样本均值形成的分布
用应用程序证明(onlinestatbook.com):任意定义概率分布,s.s=5/10,10K次取值,验证
正偏态分布:尾部朝向正数方向
正偏态分布:尾部朝向负数方向
正态分布:无偏度,良好对称
峰度(kurtosis):分布的正态程度,有正负之分
37样本均值的抽样分布
样本容量的大小对样本均值频率分布图的影响:n=1,2时,结果不太理想
n->无穷,得到正态分布
因此, 样本容量趋于∞, 样本均值的抽样分布趋于正态分布

38均值标准误差 样本容量越大对应均值不变,方差/标准差越小,越接近于正态分布
原概率分布的均值与样本均值的抽样分布的均值
39实际应用:男性户外运动,miu,sigam已知,求水不够的概率
40、45置信区间(confidence interval):一种区间估计方法,即分别以统计量的置信上限和置信下限为上下界构成的区间
步骤:求一个样本的均值;计算出抽样误差;用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
41-42伯努利试验(离散型)公式的推导:均值p,方差平p(1-p)
43-44误差范围:所统计结果中随机波动的大小。举例:
46样本容量非常小时使用t分布
t分布用来估计呈正态分布且方差未知的总体的均值
1.以0为中心,左右对称的单峰分布;
2.随着n(自由度)逐渐增大,t分布逐渐接近标准正态分布。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值