1. Ttest(T检验)
1.1 概念
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。
t检验的来历
当总体呈正态分布,如果总体标准差未知,而且样本容量<30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t分布。
检验是用 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。 检验分为单总体检验和双总体 检验。
1.单总体t检验
单总体 检验是检验一个样本平均数与一已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量 <30,那么样本平均数与总体平均数的离差统计量呈 分布。
2.双总体t检验
双总体 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体 检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。
1.2 用处
单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内。
双样本检验:其零假设为两个正态分布的总体的均值是相同的。这一检验通常被称为学生t检验。但更为严格地说,只有两个总体的方差是相等的情况下,才称为学生t检验;否则,有时被称为Welch检验。以上谈到的检验一般被称作“未配对”或“独立样本”t检验,我们特别是在两个被检验的样本没有重叠部分时用到这种检验方式。
检验同一统计量的两次测量值之间的差异是否为零。举例来说,我们测量一位病人接受治疗前和治疗后的肿瘤尺寸大小。如果治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸变小了。这种检验一般被称作“配对”或者“重复测量”t检验。
检验一条回归线的斜率是否显著不为零。
1.3 T值公式
等方差和异方差公式不同
1.4 P值计算
对T检验的T值进行进一步计算
1.5 MLlib算法
同F检验