几种常见的假设检验



定义

假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。

基本原理
  (1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。
  (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为α,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。

假设的形式

  H0——原假设, H1——备择假设

  双侧检验:H0:μ = μ0 H_1:\mu\ne\mu_0

  单侧检验:H_0:\mu\ge\mu_0 H1:μ < μ0  或  H_0:\mu\le\mu_0, H1:μ > μ0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1


假设检验的种类
下面介绍几种常见的假设检验
1. T检验
    亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知正态分布资料。

目的:比较样本均数 所代表的未知总体均数μ和已知总体均数μ0

  计算公式:

  t统计量:t=\frac{|\overline{X}-\mu_0|}{S_{\overline{X}}}=\frac{\bar{X}-\mu_0}{s/\sqrt{n}}

  自由度:v=n - 1

  适用条件:

  (1) 已知一个总体均数;

  (2) 可得到一个样本均数及该样本标准误;

  (3) 样本来自正态或近似正态总体。

T检验的步骤

  1、建立虚无假设H01 = μ2,即先假定两个总体平均数之间没有显著差异;

  2、计算统计量T值,对于不同类型的问题选用不同的统计量计算方法;

  1)如果要评断一个总体中的小样本平均数与总体平均值之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}-\mu_0}{\frac{S}{n-1}}

  2)如果要评断两组样本平均数之间的差异程度,其统计量T值的计算公式为:

  T=\frac{\bar{X}_1-\bar{X}_2}{\sqrt{\frac{\sum x_1^2+\sum x_2^2}{n_1+n_2-2}}\times\frac{n_1+n_2}{n_1\times n_2}}

  3、根据自由度df=n-1,查T值表,找出规定的T理论值并进行比较。理论值差异的显著水平为0.01级或0.05级。不同自由度的显著水平理论值记为T(df)0.01和T(df)0.05

  4、比较计算得到的t值和理论T值,推断发生的概率,依据下表给出的T值与差异显著性关系表作出判断。

T值与差异显著性关系表
T P值 差异显著程度
T\ge T(df)0.01 P\le 0.01 差异非常显著
T\ge T(df)0.05 P\le 0.05 差异显著
T T(df)0.05 P > 0.05 差异不显著

  5、根据是以上分析,结合具体情况,作出结论。

T检验的应用领域:

T检验可用于比较药物治疗组与安慰剂治疗组病人的测量差别。

2. z检验(U检验
Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。

第一步:建立虚无假设 H01 = μ2 ,即先假定两个平均数之间没有显著差异,

  第二步:计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法,

  1、如果检验一个样本平均数(\bar{X})与一个已知的总体平均数(μ0)的差异是否显著。其Z值计算公式为:

  Z=\frac{\bar{X}-\mu_0}{\frac{S}{\sqrt{n}}}

  其中:

  • \bar{X}是检验样本的平均数;
  • μ0是已知总体的平均数;
  • S是样本的标准差
  • n是样本容量。

  2、如果检验来自两个的两组样本平均数的差异性,从而判断它们各自代表的总体的差异是否显著。其Z值计算公式为:

  Z=\frac{\bar{X_1}-\bar{X_2}}{\sqrt{\frac{S_1}{n_1}+\frac{S_2}{n_2}}}

  其中:

  • \bar{X_1},\bar{X_2}是样本1,样本2的平均数;
  • S1,S2是样本1,样本2的标准差;
  • n1,n2是样本1,样本2的容量。

  第三步:比较计算所得Z值与理论Z值,推断发生的概率,依据Z值与差异显著性关系表作出判断。如下表所示:

Z值与P值关系
\left| Z \right| P值 差异程度
\ge2.58 \le0.01 非常显著
\ge1.96 \le0.05 显著
<1.96 >0.05 不显著

    第四步:根据是以上分析,结合具体情况,作出结论。

3. F检验
4. 卡方检验

  • 6
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 描述性统计分析关键指标计算方法: 描述性统计分析是指通过一些关键指标对数据进行总结和描述,常用的关键指标包括:平均数、中位数、众数、标准差、方差、最大值、最小值、分位数等。计算方法如下: - 平均数:所有数据的总和除以数据的个数。 - 中位数:将数据按大小排序,取中间位置的数,如果数据个数为偶数,则取中间两个数的平均数。 - 众数:出现最频繁的数。 - 标准差:平均数和每个数据的差的平方和除以数据的个数,再开根号。 - 方差:平均数和每个数据的差的平方和除以数据的个数。 - 最大值:数据中的最大值。 - 最小值:数据中的最小值。 - 分位数:将数据按大小排序,将数据分成若干等份,每份包含相同数量的数据,对应的数即为分位数。 2. 常见统计图表的表示方法及用途: 常见的统计图表包括直方图、饼图、折线图、散点图、箱线图等。它们的用途如下: - 直方图:用于展示数据的分布情况,横轴表示数据的范围,纵轴表示数据出现的频率。 - 饼图:用于展示不同类别数据的比例关系,每个扇形表示一个类别,扇形的面积表示该类别占总体的比例。 - 折线图:用于展示数据随时间或其他变量的变化趋势,横轴表示时间或其他变量,纵轴表示数据的取值。 - 散点图:用于展示两个变量之间的关系,横轴表示第一个变量,纵轴表示第二个变量,每个点表示两个变量的取值。 - 箱线图:用于展示一组数据的分布情况,箱体表示数据的四分位数范围,箱线表示中位数,须表示数据的整体范围。 3. 置信区间的含义以及常见的参数估计方法: 置信区间是指对于一个未知参数的估计值,以一定的置信水平给出的一个区间范围,该区间范围包含了真实参数值的概率由置信水平决定。例如,以95%的置信水平给出的置信区间,意味着在样本数量不变的情况下,有95%的概率真实参数值在该区间范围内。 常见的参数估计方法包括: - 点估计:直接用样本数据计算出未知参数的估计值。 - 区间估计:给出未知参数的估计区间,包括点估计和置信区间。 - 极大似然估计:在已知样本数据的情况下,寻找最大化似然函数的未知参数值作为估计值。 - 贝叶斯估计:在已知样本数据的情况下,基于先验分布和似然函数,计算后验分布来估计未知参数。 4. 假设检验的原理;常见几种假设检验的方法: 假设检验是指在已知样本数据的前提下,对总体或总体参数的某个假设进行检验假设检验的原理包括: - 提出假设:设定原假设和备择假设。 - 确定显著性水平:通常取0.05或0.01。 - 计算检验统计量:根据样本数据计算出检验统计量的值。 - 判断拒绝还是接受原假设:将检验统计量的值与临界值进行比较,如果检验统计量的值在拒绝域内,则拒绝原假设,否则接受原假设常见假设检验方法包括: - 单样本t检验:用于检验一个样本的均值是否等于某个给定值。 - 双样本t检验:用于检验两个样本均值是否相等。 - 方差分析:用于检验多个样本均值是否存在显著差异。 - 卡方检验:用于检验两个或两个以上分类变量之间是否有关联。 - 相关分析:用于检验两个变量之间是否存在线性关系。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值