0阶贝塞尔函数_卡方分布的概率密度函数和它的一些衍生问题

本文介绍了卡方分布的概念、起源及其概率密度函数的推导,特别关注了0阶贝塞尔函数在其中的作用。通过极坐标变换,详细展示了df=1、2、3时的概率密度函数计算,并给出了df=n的一般情况。同时,讨论了卡方分布与正态分布之间的内在联系,以及其在统计学中的应用,如t分布和F分布的推导。
摘要由CSDN通过智能技术生成

最近在上一门叫做生物统计学与试验设计的课(估计大二+的人会比较熟悉),里面讲到了3种重要的统计分布。但让我感到非常奇怪的是,书上和老师的给我们讲的是,介绍了这个分布的概念,下一步直接翻附表查概率,其余基本啥也没讲。这让我感到好奇心大受挫损,遂在课余时间研究推导了一下这些分布(也有的推导过程是我上网查询的),写了这篇文章。

卡方分布定义:

X1, X2, …, Xi, …, Xn~N(0, 1)且X1, X2, …, Xi, …, Xn相互独立(或(X1, X2, …, Xi, …, Xn)是某个标准正态总体某次独立随机抽样的样本),则称Y=ΣXi2服从df=n的卡方分布,写作Y~χ²(n)。这个分布由詹姆斯·麦克斯韦(James Clerk Maxwell, 1831-1879)在研究空气分子的运动速度的分布时发现的,他发现分子运动速度的平方v²~χ²(3)。后来又有多人提出这种分布,例如弗里德里希·罗伯特·海尔默特(Friedrich Robert Helmert, 1843-1917)于1875年,故卡方分布有时(在德国常见,因海尔默特是德国人)也称海尔默特分布;另外,这一结果被英国生物统计学家、优生学家、数理统计学创始人和社会达尔文主义理论家卡尔·皮尔逊(Karl Pearson, 1857-1936)推广并于1900年发表。

5c0430097a26580cd332ed1e31ef5ec3.png
卡尔·皮尔逊,1912年

下面推导χ²分布的概率密度函数。

对于df=1,有

fa68da5ee9de0d0dd4af26bd78fb61c6.png

9fd36b973e1cee1d5563c30b7241ab9f.png

对于df=2,可将所得的二重积分做极坐标变换处理,于是

06ab89872c5651ab8f5b029509ec2122.png

其中D是一个以原点为圆心的圆区。

fc48706b481bd9274671ff746cf72fd0.png

对于df=3,有

df8cc0317d106445e4334b8736504819.png

b072a8afdb5c3f9c3aec5ecfad647322.png

需要说明一下,这里对加以处理时使用的球坐标系方法也一般性地称作“极坐标系”(也有之后表述方便之需要)。

则对于一般情况df=n,有

5cf959072d0eec7e962005f7d4df68cf.png

根据观察推敲和前面的推导过程实际上可以发现,式中除了最后一项是x的函数以外,其他全是常数。其原因在于,在极坐标积分确定的体积元中有关角度的项只与维数(自由度)n有关,而与r本身无关。所以上面的积分可以重新表示为

772e9d2fcfe58af6a4c3cc5c8879899d.png

其中An是常数。

(严谨起见,又把被1/2π消掉的第一项写了回来。)

如果强行根据维数推广极坐标系,数学上将是非常困难的。(当然,其实主要还是因为我们没法想象高维空间,所以也很难直观地用几何的方法构造体积元。再说了,即便我们推了很多个不同维数的极坐标系体积元,然后归纳得出了一个一般情况,我们何成能证明它呢?)但我们有其他的方法可以避开这个复杂的步骤。根据归一化条件,应该有

0f59de0576641b6de654fd5d1cd89e99.png

换元t=ρ²/2,dt=ρdρ,上面的方程变为

4952a71f568a9feac15c61c02a48213f.png

注意到这个积分是伽马函数

f76eab929a35fbcdf5455ecce9b6cece.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值