11.4~11.5置信区间、方差检测(部分)

极大似然估计应是使似然函数达到最大的那个值

无偏性:多次抽样中,这些样本得到的参数估计值的平均值和总体参数一致

这里面参数就是概率p,似然函数的目的是要求解p

对于均值,方差,样本量的总体,如果是正太分布,或者非正态但样本量总体大,

样本均值的抽样分布,则服从标准正态分布

样本容量n与总体方差成正比,与绝对误差成反比,与概率度成正比 

估计总体均值时样本容量的确定

就是说想要直到总体的一个均值,需要取样多少

置信区间、置信水平

置信水平是说构造多次置信区间,那么包含真正参数的区间占这么多区间总数的比例,置信水平是1-α,显著性水平是α

方差分析

思想

目的是想知道四个行业之间的服务质量是否有显著差异

同一行业的不同公司就是随机误差,行业的服务质量差异水平就是系统误差

根据投诉次数来确定

数据的误差用平方和表示

 

假设 

假设每个总体都服从正态分布,

比如每个行业被投诉的次数,一共四个行业,如果无明显差异的服务水平,那么被投诉的次数分布应该都是参数差不多的正态分布。在每个行业取样的时候,也就是在各个总体里正态分布取样

可以说这个假设充分考虑了取样时的随机误差

每个总体的方差都相同

就是说假设的每个总体的样本都是自己的正太分布,但是他们的方差都相同,唯一可能不同的就是他们正太分布的均值,均值不同会导致取样的整体情况产生差异 

检验

全部观察值与总平均值的差平方和,反映全部观察值的离散状况

各组平均值与总平均值的差平方和,组间平方和,既包含随机误差也包括系统误差,之所以反映随机误差是因为每组的均值不一定接近实际的,即每组各自的均值就代表了一定的随机误差

而组的均值与整体均值之间的差距,又一定包含了系统误差,所以既包含随机又有系统

水平项离差平方和,反映的是随机误差大小;SSE不涉及到组内和整体均值的比较,所以不反应系统误差,只反映各组内的随机误差

SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小

 

如果原假设成立,则表明没有系统误差

组间方差如果比组内方差大,显著的大,就说明存在系统误差;不然,就说明系统误差很小

SST好像用处不是很大

直觉上MSA应该大于MSE,即F>1,因为MSA除了随机误差还包含系统误差,即组平均值和整体平均值的差异,MSE只包含随机误差

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值