![4f89487047f8699481d7b16821318a41.png](https://img-blog.csdnimg.cn/img_convert/4f89487047f8699481d7b16821318a41.png)
本次梳理以网易公开课-可汗学院-统计学为主,《深入浅出统计学》为辅。
47-61集 假设检验
假设检验与区间估计都是根据样本信息推断总体分布。两者可以相互装转换唯一的区别是参数知不知道的问题。举例来说:统计全校学生(总体)的平均上网时间(参数),如果参数未知,通过样本进行推断则是区间估计,如果有人已经得到平均上网时间(参数),而你不知道这个参数可不可靠,则是假设检验,换句话说无假设不检验。
显著性水平:显著性水平是人为规定的,一般会取0.05,亦有0.01等其他值。
p值:P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为有统计学差异, P<0.01 为有显著统计学差异,P<0.001为有极其显著的统计学差异。
通过将计算出的P值和显著性水平比较可以确定是否应拒绝原假设,即假设检验
单侧检验:指当要检验的是样本的参数值大于或小于某个特定值时,采用的统计检验方法。
单侧检验包括左单侧检验和右单侧检验两种。如果所要检验的是样本所取自的总体的参数值是否大于某个特定值时,则采用右单侧检验;反之,若所要检验的是样本所取自的总体的参数值是否小于某个特定值时,则采用左单侧检验。
双侧检验:当统计分析的目的是要检验样本平均数和总体平均数,或样本成数有没有显著差异,而不问差异的方向是否是正差还是负差时,所采用的一种统计检验方法。
假设检验:假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。
常见有Z检验、T检验、卡方检验、F检验等
Z检验:样本量大,随机变量符合正态分布时用到。
T检验:当样本数量小于30时,样本分布不再符合正态分布而是符合T分布。
T分布只有一个自由度参数n,当n趋于无穷时,T分布变为标准正态分布,其实T分布只是正态分布的一种近似,是正态分布在小样本时的形态。计算置信区间的方法和正态分布类似,不同的是要查t分布表而不是z分布表。
卡方检验:清晰的讲解卡方分布与卡方检验。
https://blog.csdn.net/bitcarmanlee/article/details/52279907blog.csdn.netF检验:
T检验与F检验的区别_f检验和t检验的关系 - 数据分析www.cdadata.comH0:把原先设定的假设称为原假设,记作H0。T检验与F检验的区别_f检验和t检验的关系 - 数据分析H0:把原先设定的假设称为原假设,记作H0。
H1:把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。
第一型错误:当原假设H0为真而拒绝原假设的错误,称为假设检验的第一类错误,又称为拒真错误。
t统计量:t统计量是用于T检验中,主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。
![e3f60c9068f3175cde6cd4887cec879e.png](https://img-blog.csdnimg.cn/img_convert/e3f60c9068f3175cde6cd4887cec879e.png)
t统计量置信区间:和Z统计量的计算区别在于一个是Z表格,另一个是T表格,其他和Z统计量置信区间一致。
随机变量之差的方差:两个独立的随机变量其差的方差等于方差的和,即D(X-Y)=D(X)+D(Y)。