R语言的单个总体的T检验

最新推荐文章于 2022-09-16 18:03:41 发布

无你想你

最新推荐文章于 2022-09-16 18:03:41 发布

阅读量1.1k

点赞数 2

分类专栏： R语言学习文章标签： r语言开发语言

本文链接：https://blog.csdn.net/qq_62904883/article/details/126426743

版权

R语言学习专栏收录该内容

11 篇文章 1 订阅

订阅专栏

本文详细介绍了单个总体的t检验，包括t检验的目的、原假设设定、检验统计量的选择、P值计算以及根据显著性水平做决策的过程。通过具体的案例展示了如何在R语言中进行t检验，并解释了检验结果。文章强调了根据原假设选择检验类型的重要性，并提供了实际数据进行演示。

摘要由CSDN通过智能技术生成

学习目标

我们所采用的学习内容来自B站的Lizongzhang老师的R语言的学习分享以及统计分析与spss的应用
今天学习的主要内容是关于
单个总体的t检验

学习内容

下面是学习的主要内容

单个总体的t检验

t检验的目的

t检验是使用某总体的样本数据，推断该总体的均值是否指定的检验值存在显著差异，这是对总体均值的假设检验。

提出原假设

$H_0:\mu=\mu_0$
$H_1:\mu \ne \mu _0$
注:

制定原假设: $H_0:\omega =\omega _0$ 和备择假设 $H_1$ ,这里在选择检验方法的时候有一个小方法帮助大家选择:
– 如果是 $H_1:\omega >\omega _0$ ,那么选择的就是右侧检验
– 如果 $H_1:\omega <\omega _0$ ,那么选择的检验就是左侧检验
– 如果 $H_1:\omega \ne \omega _0$ ,那么假设检验就是选择使用双侧检验

选择检验统计量

希望利用样本均值去估计总体均值
当总体分布为正态分布 $N\left( \mu ,\sigma ^2 \right)$ 的时候,样本均值 $\bar{X}$ 的抽样分布仍然为正态分布,及 $\bar{X}\sim N\left( \mu ,\frac{\sigma ^2}{n} \right)$
其中 $\mu$ 表示总体均值, $\sigma^2$ 表示总体方差, $n$ 为样本量,在样本 $n$ 足够大的情况下,根据中心极限定理可知样本均值也服从上述的正态分布.进一步的对 $\bar{X}$ 进行标准化,可以得到 $Z=\frac{\bar{X}-\mu}{\sqrt{\frac{\sigma ^2}{n}}}$
在总体方差位置的情况下,用样本方差 $S^2$ 替代总体方差,可以得到 $t$ 统计量
$Z=\frac{\bar{X}-\mu}{\sqrt{\frac{S^2}{n}}}$
$t$ 统计量服从n-1自由度的 $t$ 分布(n-1的自由度是为了更好的做到无偏估计)
在一般情况下因为总体方差是未知的,所以一般情况下都是使用单样本的 $t$ 检验

计算检验统计量的观测值和概率P-值

计算检验统计量的观测值和对应的概率 $P -$ 值,计算得到相应的 $t$ 统计量,然后得到对应的双侧概率P-值,便于下一步的检验

给定显著性水平 $\alpha$ 做出决策

给定显著性水平 $\alpha$ ,这个值可以根据题目以及自身的判断给出相应的值的大小,一般情况下 $\alpha$ 的取值是 $0.10, 0.05, 0.01$ 这三个值进行选择,然后根据上一步计算得到的 $P$ 值与 $\alpha$ 进行比较
在这里插入图片描述
如上图,那么可以根据 $\alpha$ 的大小划分接受域和拒绝域,若P值落在拒绝域则拒绝原假设,反之则接受原假设

具体使用案例

因为在下载老师数据对应的数据有一定的麻烦,就直接根据视频里的进行手动的敲入

#单个总体均值的T检验
#某周电子元件的寿命x服从正态分布,观测其16只元件的寿命
a<-c(159,280,101,212,224,379,179,264,
     222,362,168,250,149,260,485,170)
mean(a)#求出样本均值
sd(a)
t.test(a,mu=225,alternative =c("greater") )
#当做单侧检验的时候要写greater,双侧检验可以不写
#conf.level=0.95可以不写,但是如果是其他的置信水平就要进行更改
t.start<-(mean(a)-225)/(sd(a)/sqrt(16))
t.start
p.value<-1-pt(t.start,15)
p.value

对应的输出对象如下:
在这里插入图片描述

在这种情况下一般不拒绝原假设

具体使用情况2

根据书本统计分析与spss的应用上的具体案例:推断信用卡刷卡金额的平均值是否低于3000,进行检验

library(readxl)
credit_card<- read_excel("信用卡刷卡.xlsx",col_types = c("numeric"))
View(credit_card)
colMeans(credit_card)
sqrt(var(credit_card))
t.test(credit_card,mu=3000,alternative =c("greater") )