相关系数
总体
考察对象的全部个体
样本
总体中抽取的个体(简单随机抽样、分层抽样)
通过对样本特征的计算得到总体的特征
(皮尔逊)相关系数
总体协方差
皮尔逊相关系数
反映变量的线性相关指标(所以求皮尔逊系数前‘必须确定关系是线性的,判断皮尔逊相关系数前需看看散点图大致形状)
假设检验法
前置概念
PDF
CDF
概率分布的函数需要根据实际情况确定。
** 示例 **
以下是一个假设检验的示例:
假设一家医院想研究一个新药对治疗某种疾病的疗效。医院招募了100名患者,将他们随机分为两组,一组服用新药,另一组服用安慰剂。为了评估新药的疗效,研究人员记录了两组患者的病情变化,并比较了两组患者的平均病情变化程度。假设研究人员想测试这个新药是否比安慰剂更有效。
原始假设(H0):新药的治疗效果与安慰剂无差异。
备择假设(Ha):新药的治疗效果比安慰剂更有效。
选择显著性水平(α):假设显著性水平为0.05。
选择统计检验方法:这个问题可以采用双样本t检验(two-sample t-test)来进行假设检验。计算两组样本的平均值和方差,然后使用t检验来比较两组样本的平均值是否有显著性差异。
计算检验统计量的值:在假设检验中,t检验的检验统计量为:
t = (x1 - x2) / (sqrt(s12/n1 + s22/n2))
其中,x1和x2分别是两组样本的平均值,s1和s2分别是两组样本的标准差,n1和n2分别是两组样本的大小。
根据假设检验的假设,如果新药的治疗效果与安慰剂无差异,那么两组样本的平均值应该相等。因此,如果t检验的值较大,则说明新药的治疗效果比安慰剂更好。
计算拒绝域:在显著性水平为0.05的情况下,使用t分布表可以得到双侧检验的临界值为2.00(自由度为98)。
比较检验统计量的值与拒绝域的临界值:假设计算得到的t值为2.50,大于双侧检验的临界值2.00,因此t检验的值落在拒绝域内,可以拒绝原始假设。
根据检验结果得出结论:因为t检验的值落在拒绝域内,我们可以拒绝原始假设,接受备择假设,即新药的治疗效果比安慰剂更好。因此,研究人员可以得出结论,新药比安慰剂更有效。
需要注意的是,在这个例子中,我们采用的是双侧检验,因为备择假设中并没有指定哪种情况更有可能发生。如果备择假设指定了哪种情况更可能发生(比如,新药的治疗效果更好),那么我们可以采用单侧检验来检验这个假设。
此外,还需要注意到假设检验的结果只能说明我们的数据是否支持一个假设,而不能证明这个假设一定是正确的。因此,在进行假设检验时,需要谨慎地选择假设和显著性水平,并且需要结合其他数据和知识来进行决策。
皮尔逊相关系数假设检验
条件
1.实验数据来自正态分布的总体
2.实验数据间差距不能太大
3.每组样本间独立抽样
验证条件(正态分布)是否满足
1.JB检验(大样本n>30)
MATLAB中进行JB检验的语法:[h,p] = jbtest(x,alpha)
当输出h等于1时,表示拒绝原假设;h等于0则代表不能拒绝原假设。
alpha就是显著性水平,一般取0.05,此时置信水平为1‐0.05=0.95
x就是我们要检验的随机变量,注意这里的x只能是向量
2.Shapiro-wilk检验(小样本n<50)
比较复杂直接上操作
用spss–分析–探索 直接得出夏洛克检验的结果
显著性即为p-value,若大于0.05则接受,否则拒绝
3.Q-Q图(大样本>100)
步骤
1.提出假设
原假设H0,备择假设H1
2.构造符合某一分布的统计量
3.将检验的值带入统计量,得到特定的值
4.根据统计量的分布特征,以及置信水平(置信区间的概率),查表求出接受域和拒绝域
运用p值检验法,得出在**%的置信水平上接受/拒绝原假设
皮尔曼相关系数检验
要得到X,Y的相关系数,运行
coef=corr(X,Y,'type','Spearman')
即可得出结果,不再赘述
要得到矩阵Test各列之间的相关系数,运行
coef=corr(Test,'type','Spearman')
假设检验
小样本查表
大样本