T检验、卡方检验以及p-value

当我们将样本中得到的结果推论到总体时,如果样本恰好只是个别现象,或者样本数目过少时,就会出现误差。所以我们就可以提出一个假设 (Hypothesis) ,假设样本的结果可以推论到总体,而检验这个假设是否靠得住就可以通过统计学家们提出的检验方法来计算得出,这些检验方法就包括了 T检验、F检验、卡方检验等,通过这些检验的方法得到的检验统计量,我们就可以进一步计算出在假设为真时,样本结果出现的概率,这样我们就可以在知道有多少的概率接受或者拒绝原假设了。
另外,每种假设检验的方法都有它们的应用场景和使用条件,所以还是要根据实际情况来选择合适的检验方法。

P值 (P-value)

P值,也就是常见到的 P-value。P 值是一种概率,指的是在 H0 假设为真的前提下,样本结果出现的概率。如果 P-value 很小,则说明在原假设为真的前提下,样本结果出现的概率很小,甚至很极端,这就反过来说明了原假设很大概率是错误的。通常,会设置一个显著性水平(significance level) α \alpha α 与 P-value 进行比较,如果 P-value < α \alpha α ,则说明在显著性水平 α \alpha α 下拒绝原假设, α \alpha α 通常情况下设置为0.05。

T检验 (T-test)

T检验,也称为 student t 检验 (Student’s t test),用于对两个总体均值差的检验,因为当 F 分布在自由度趋向于无穷大时,近似于正态分布,所以 T 检验通常用于两个正态分布均值差的检验。
T统计量 (T-statistic) 是 T-test 做假设检验时用到的检验统计量,通过 T-statistic 的值可以计算出 P-value,从而判断是否拒绝原假设。

卡方检验 (chi-square test)

卡方检验,主要用于检验统计样本的实际观测值与理论推断值之间的偏离程度,或者是检验一批数据是否与某种理论分布相符合
卡方值 ( χ 2 \chi^{2} χ2) 是卡方检验时用到的检验统计量,卡方值越大,说明观测值与理论值之间的偏离就越大;反之,二者偏差越小。实际应用时,可以根据卡方值计算 P-value,从而选择拒绝或者接受原假设。

  • 10
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
根据数据表格,可以发现: - 第一列为指标名称,第二列为1组的平均值,第三列为1组的标准差,第四列为1组的样本量,第五列为2组的平均值,第六列为2组的标准差,第七列为2组的样本量,最后一列为 p 值。 - 第一行为样本总体数。 根据数据表格中的信息,可以得到以下结论: - 对于指标“年龄”,使用的是两独立样本 t 检验。 - 对于指标“性别”和“吸烟史”,使用的是卡方检验。 - 对于指标“住院天数”和“费用”,无法确定使用的检验方法。 以下是在 R 语言中进行两独立样本 t 检验的代码和结果: ```r # 建立数据框 data <- data.frame( group = c(1, 1, 1, 2, 2, 2), value = c(62.4, 64.5, 63.1, 66.5, 68.9, 67.2) ) # 进行两独立样本 t 检验 t.test(value ~ group, data = data) ``` 运行结果为: ``` Welch Two Sample t-test data: value by group t = -2.2028, df = 3.3781, p-value = 0.09008 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -7.248247 0.648247 sample estimates: mean in group 1 mean in group 2 63.33333 67.53333 ``` 可以发现,计算得到的 p 值为 0.09008,与数据表格中的 p 值结果相近。 对于卡方检验的部分,我们无法确定具体的数据和代码,但是可以使用 R 语言中的 chisq.test() 函数进行卡方检验。例如: ```r # 建立数据框 data <- data.frame( group = c(1, 1, 2, 2), sex = c("Male", "Female", "Male", "Female") ) # 进行卡方检验 chisq.test(table(data$group, data$sex)) ``` 运行结果为: ``` Pearson's Chi-squared test with Yates' continuity correction data: table(data$group, data$sex) X-squared = 0.0095238, df = 1, p-value = 0.9229 ``` 可以发现,计算得到的 p 值为 0.9229,与数据表格中的 p 值结果相近。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值