2×3卡方检验prism_典型概率分布及其物理意义(2)

eff893c840796dd08737ddc8a592e11f.png

这一篇文章将讲正态分布及由正态分布推导出来的其他相关分布。

  • 正态分布

正态分布在生活中无处不在,人们的身高体重,智力水平都服从或者说近似服从正太分布。其概率密度函数为:

正态分布的神奇之处在于,所有分布在一定情况下都收敛于正态分布。也就是我们说的中心极限定理:假设

是独立同分布(independent and identically distributed),那么他们的和或者均值服从近似正态分布,并且随着n越来越大,越接近正态分布。

比如我用R模拟产生了10000个0到1之间的随机数,然后每10个求和,最后得到1000个数。下图是这1000个数的柱状分布图,可以看出基本上符合正态分布的形状。

e3f32a5652dd2c4acd7507e1f6591e49.png

如果我们把随机数换成比如泊松分布,结果也是一样的,可以自行用软件尝试。中心极限定理也可以用公式来表示,

其中,μ表示原分布的均值,n表示相加的样本个数,

表示原分布的方差。在上面的例子中,我们用的是0到1之间的均匀分布,也就是说均值为0.5,方差为1/12,并且n取值为10,那么根据公式,他们的和近似服从均值为5(与图中一致),方差为10/12的正态分布。

正态分布在统计假设检验中有着不可替代的第位,这里不赘述。

  • 卡方分布(

卡方分布的概率密度函数为如下所示,

4bdc4637880ceeb1d6edf1710ae2881a.png

这里有两种对于卡方分布定义:

  1. 卡方分布为伽马分布的一种特殊形式,我们将伽马分布中的k取n/2, θ取2,就可以得到卡方分布的概率密度函数。
  2. 假设
    为独立同分布,并且他们都服从标准正态分布,那么
    服从
    卡方分布分布。

其中n代表自由度,直观理解,第二种解释更能够表达自由度的来源,也就是n个独立标准正态分布平方和。

  • 学生t分布

学生t分布的概率密度函数如下所示,

8ff0621d3b973eaf11236501124e597e.png

假设Z服从标准正态分布 (N(0,1) ),X服从自由度为n的卡方分布(

),那么
服从自由度为n的t分布 (
)。

t分布是一种采样分布,用来描述小样本下的的统计量。通常来讲,假设

,那么统计量
服从标准正态分布。但是现实中标准差σ通常并不知道,于是我们需要用样本方差s来替换σ。于是这个新的统计量
,服从t分布。当n趋近于无穷大的时候,样本标准差s就无限接近于真实标准差σ,于是t就趋近于标准正态分布。

接下来我们来看看这个新的统计量t是怎么和前面的定义(正态分布和卡方分布)联系起来的。假设

独立同分布,并且服从
,那么他们的均值和样本方差为,

894699414a5f6b470a5af0b536c960fa.png

我们知道:

  1. 是独立的随机变量。
  2. 同样满足均值和方差为
    的正态分布。
  3. 服从自由度为n-1的卡方分布(如前一节所讲,卡方分布为正态独立变量的平方和)。

那么回到统计量t的定义式,我们可以改写为如下,

63330eadaab6ce935bf00d8f78a9c501.png

于是,分子部分为标准正太分布,分母部分为(n-1)分之卡方分布的平方根,就得到了本小节最开始对t分布的表示方法。

t分布的强大之处在于做统计检验的时候并不需要事先知道方差(上述计算的过程也可以看出通过构造正态分布和卡方分布来将分子分母的σ消掉),只取决于样本的大小,于是在小样本估计(均值)的时候,会(比正态分布)更加准确。当然,n越大,t分布就越来越接近于标准正态分布。

  • F分布

F分布的定义是,如果

,那么
服从
分布。

F分布也属于采样分布,我们在上面的例子知道了,样本方差经过变形后服从卡方分布,那么不难知道,根据上述F分布的定义(分母和分子都包含独立的卡方分布数据),两组(正态)数据方差的比例满足F分布。

假设有两组独立正态分布的数据

,假设
(n个样本)和
(m个样本)为他们分别的样本方差,那么
分别服从自由度为n-1和m-1的卡方分布。于是,我们可以构建
服从F分布。

如果我们有原假设

。在原假设的条件下,
。于是我们则可以通过F分布的表格来查看是否存在显著性。

F分布经常用于方差分析(ANOVA)中,用于检验组间方差和组内方差是否相同,从而判断两组数据的均值是否相等。(详情搜索ANOVA)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值