假设检验与参数估计的R语言实现

假设检验是推论统计中用于检验统计假设的一种方法。而“统计假设”是可通过观察一组随机变量的模型进行检验的科学假说。一旦能估计未知参数,就会希望根据结果对未知的真正参数值做出适当的推论。

统计上对参数的假设,就是对一个或多个参数的论述。而其中欲检验其正确性的为零假设(null hypothesis),零假设通常由研究者决定,反应研究者对未知参数的看法。相对于零假设的其他有关参数之论述是备择假设(alternative hypothesis),它通常反应了执行检定的研究者对参数可能数值的另一种(对立的)看法(换句话说,备择假设通常才是研究者最想知道的)。

假设检验的种类包括:t检验,Z检验,卡方检验,F检验等等。

说明

假设检验的过程,可以用法庭的审理来说明。先想像现在法庭上有一名被告,假设该被告是清白的,而检察官必须要提出足够的证据去证明被告的确有罪。 在证明被告有罪前,被告是被假设为清白的。
假设被告清白的假设,就相当于零假设(null hypothesis)。
假设被告有罪的假设,则是备择假设(alternative hypothesis)。

而检察官提出的证据,是否足以确定该被告有罪,则要经过检验。 这样子的检验过程就相当于用T检验或Z检验去检视研究者所搜集到的统计资料。

检验过程

在统计学的文献中,假设检验发挥了重要作用。假设检验大致有如下步骤:(最初研究假设为真相不明)

  • -: 第一步是提出相关的零假设和备择假设。这是很重要的,因为错误陈述假设会导致后面的过程变得混乱。
  • -: 第二步是考虑检验中对样本做出的统计假设;例如,关于独立性的假设或关于观测数据的分布的形式的假设。这个步骤也同样重要,因为无效的假设将意味着试验的结果是无效的。
  • -: 决定哪个检测是合适的,并确定相关检验统计量 T。
  • -: 在零假设下推导检验统计量的分布。在标准情况下应该会得出一个熟知的结果。比如检验统计量可能会符合学生t-分布或正态分布。
  • -: 选择一个显著性水平 (α),若低于这个概率阈值,就会拒绝零假设。最常用的是 5% 和 1%。
  • -: 根据在零假设成立时的检验统计量T分布,找到数值最接近备择假设,且概率为显著性水平 (α)的区域,此区域称为“拒绝域”,意思是在零假设成立的前提下,落在拒绝域的概率只有α。
  • -: 针对检验统计量T,根据样本计算其估计值tobs。若估计值tobs未落在“拒绝域”,接受零假设。
  • -:若估计值tobs落在“拒绝域”,拒绝零假设,接受备择假设。

例子

淑女品茶是一个有关假设检验的著名例子,费雪的一个女同事声称可以判断在奶茶中,是先加入茶还是先加入牛奶。费雪提议给她八杯奶茶,四杯先加茶,四杯先加牛奶,但随机排列,而女同事要说出这八杯奶茶中,哪些先加牛奶,哪些先加茶,检验统计量是确认正确的次数。零假设是女同事无法判断奶茶中的茶先加入还是牛奶先加入,备择假设为女同事有此能力。

若单纯以概率考虑(即女同事没有判断的能力)下,八杯都正确的概率为1/70,约1.4%,因此“拒绝域”为八杯的结果都正确。而测试结果为女同事八杯的结果都正确,在统计上是相当显著的的结果。

参数估计

估计理论是统计学和信号处理中的一个分支,主要是通过测量或经验数据来估计概率分布参数的数值。这些参数描述了实质情况或实际对象,它们能够回答估计函数提出的问题。

例如,估计投票人总体中,给特定候选人投票的人的比例。这个比例是一个不可观测的参数,因为投票人总体很大;估计值建立在投票者的一个小的随机采样上。

又如,雷达的目的是物体(飞机、船等)的定位。这种定位是通过分析收到的回声(回波)来实现的,定位提出的问题是“飞机在哪里?”为了回答这个问题,必须估计飞机到雷达之间的距离。如果雷达的绝对位置是已知的,那么飞机的绝对位置也是可以确定的。

在估计理论中,通常假定信息隐藏在包含噪声的信号中。噪声增加了不确定性,如果没有不确定性,那么也就没有必要估计了。

代码示例

set.seed(100)
x<-rnorm(50,mean=5,sd=2)
t.test(x,mu=5)$conf


(4.293170+5.359834)/2

x=c(1.22,1.23,1.18,1.31,1.25,1.22,1.24)
t.test(x,mu=1.2357,alt="less",conf=0.4,var=2)
# ?t.test


x=c(1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42)
y=c(1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38)
var.test(x,y,conf=0.9)


x=c(10.2,10.5,10.3,10.8,9.8,10.6,10.7,10.2,10.0)
y=c(9.8,9.6,10.1,10.2,10.7,9.7,9.5,9.8,9.9)
t.test(x,y)


A=c(81,79,82,79,83,80,83,81,80,77,74,81)
B=c(76,79,80,75,77,74,76,80,82,79,75,81)
t.test(A,B,alt="g",p=T)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

陆嵩

有打赏才有动力,你懂的。

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值