卡方分布

最新推荐文章于 2024-06-11 21:44:38 发布

Emma_bbb

最新推荐文章于 2024-06-11 21:44:38 发布

阅读量4.6k

点赞数 4

本文链接：https://blog.csdn.net/weixin_43174621/article/details/85098919

版权

卡方分布

1 卡方分布与伽马分布

若随机变量 $\chi^2$ 服从参数为 $n$ 的卡方分布 — $\chi^2(n)$ ，则它的密度函数是：
$p(x)=\frac{({\frac{1}{2})}^{\frac{n}{2}}}{\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}~~(x\geq0)$

其中： $\Gamma(\frac{n}{2})=\int^{+\infty}_0t^{\frac{n}{2}-1}e^{-t}dt.$
可以看出， $\chi^2$ 分布的密度函数与 $G a m m a$ 分布的密度函数很相似：
$f(y)=\left\{ \begin{aligned} \frac{\beta^\alpha}{\Gamma(\alpha)}y^{\alpha-1}e^{-\beta{y}},(y\geq0)\\ ~0,~~~~~~~~~~~(y<0) \end{aligned} \right.$

其中， $\Gamma(\alpha)=\int_0^{+\infty}t^{\alpha-1}e^{-t}dt$ .

事实上， $\chi^2(n)$ 等价于 $Ga(\frac{n}{2},\frac{1}{2})$ . 接下来证明这一点。

服从 $\chi^2(n)$ 的随机变量 $\chi^2$ 是 $n$ 个独立随机变量的组合： $\chi^2=X_1^2+X_2^2+...+X_n^2,~~$ 其中 $X_1,X_2,...,X_n$ 独立同分布于标准正态分布N(0,1).

$X_1$ 的密度函数为： $p(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$ 由此可推出 $Z=X_1^2$ 的密度函数为：

$\left\{ \begin{aligned} \frac{1}{\sqrt{2\pi}\sqrt{z}}e^{-\frac{z}{2}},(z\geq0)\\ 0,~~~~~~~~~~(z<0)\\ \end{aligned} \right.$
证明如下：

$F_Z(z)=P(Z\leq z)=P(X_1^2\leq z)=P(-\sqrt{z}\leq X_1\leq\sqrt{z})=F_{X_1}(\sqrt{z})-F_{X_1}(-\sqrt{z})$

两边同时求导：
$f_Z(z)=\frac{f_{X_1}(\sqrt{z}) - f_{X_1}(-\sqrt{z})}{2\sqrt z}=\frac{1}{\sqrt{2\pi}\sqrt{z}}e^{-\frac{z}{2}}.$

由于 $\Gamma(\frac{1}{2})=\int^{+\infty}_0t^{-\frac{1}{2}}e^tdt=\sqrt{\pi}.$

[ $\Gamma$ 函数又称为第二欧拉积分，这个值可以根据余元公式求出，也可以根据正态分布密度函数积分等于1直接得出，可参考https://wenku.baidu.com/view/7042411e561252d381eb6e25.html]

可以看出来 $Y=X_1^2$ ~ $Ga(\frac{1}{2},\frac{1}{2})$ .

证明完毕。

由于 $G a m m a$ 分布具有可加性，即 $X_1$ ~ $Ga(\alpha_1,\beta)$ , $X_2$ ~ $Ga(\alpha_2,\beta)$ , $X_1$ 与 $X_2$ 独立，则 $Y=X_1+X_2$ ~ $Ga(\alpha_1+\alpha_2, \beta)$ ,这个性质可以用卷积公式证明,证明如下：

卷积公式：有相互独立的随机变量 $X, Y$ , $Z = X + Y$ , 则 $f_Z(z)=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx$

$f_Y(y)=\int_{-\infty}^{+\infty}f_{X_1}(x)f_{X_2}(y-x)dx$
$~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\int_{0}^{y}\frac{\beta^{\alpha_1}}{\Gamma(\alpha_1)}x^{\alpha_1-1}e^{-\beta{x}}\frac{\beta^{\alpha_2}}{\Gamma(\alpha_2)}(y-x)^{\alpha_2-1}e^{-\beta{(y-x)}}dx$
$~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\int_{0}^{y}\frac{\beta^{\alpha_1+\alpha_2}}{\Gamma(\alpha_1)\Gamma(\alpha_2)}x^{\alpha_1-1}(y-x)^{\alpha_2-1}e^{-\beta{y}}dx$
$~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\frac{\beta^{\alpha_1+\alpha_2}}{\Gamma(\alpha_1)\Gamma(\alpha_2)}e^{-\beta{y}}\int_{0}^{y}x^{\alpha_1-1}(y-x)^{\alpha_2-1}dx$
$~~~~~~~~~~~~~~~~~~~~~(令\frac{x}{y}=t)~~~~~~~~~~=\frac{\beta^{\alpha_1+\alpha_2}}{\Gamma(\alpha_1)\Gamma(\alpha_2)}e^{-\beta{y}}y^{{\alpha_1+\alpha_2-1}}\int_{0}^{1}t^{\alpha_1-1}(1-t)^{\alpha_2-1}dt$
$~~~~~~~~~~~~~~~~~~~~~~~~~~~~~=\frac{\beta^{\alpha_1+\alpha_2}}{\Gamma(\alpha_1)\Gamma(\alpha_2)}e^{-\beta{y}}y^{{\alpha_1+\alpha_2-1}}B(\alpha_1,\alpha_2)$

$B e t a$ 函数与 $\Gamma$ 函数有关系式： $B(a,b)=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$ ，这个等式可根据函数的定义通过变量代换证明。

$~~~~~~~~~~~=\frac{\beta^{\alpha_1+\alpha_2}}{\Gamma(\alpha_1+\alpha_2)}y^{\alpha_1+\alpha_2-1}e^{-\beta{y}}.$
证明完毕。
根据 $G a m m a$ 分布的可加性，很容易得出：
$\chi^2(n)~~等价于~~ Ga(\frac{n}{2},\frac{1}{2}).$

2 四格表中的卡方拟合优度检验

在检验临床药物有效性的实验设计时，经常会列出一个四格表，然后使用 $\chi^2$ 统计量进行拟合优度检验，其原理解释如下。
hongsec 在这里插入图片描述
黑色代表的是实际的实验结果，红色代表的是在药物1和药物2药效相同的情况下，理论的实验结果（即在假设药物1与药物2药效相同的情况下的实验结果）。 $\pi$ 指的是使用两种药物的病人被治愈的概率相等-都为 $\pi$ ，理论频数等于服用某种药物的人数乘以服用这种药物被治愈的概率。例如，选择 $m$ 个病人服用药物1，服用药物1被治愈的概率是 $\pi$ ,那么四格表中 $Y - M$ 的理论频数就为 $m\pi$ .

现在设药物1的有效率为 $\pi_1$ ,现在设药物1的有效率为 $\pi_2$ .

可以把每一个服用了药物1的病人看作是一个0-1分布，被治愈取1，没有被治愈取0，
则对于药物1来说，相当于做了 $m$ 次独立的 $B e r n o u l l i$ 实验，成功的次数为k. 把成功的次数定为随机变量 $K$ , 即 $K\sim B(m,\pi_1)$ , 根据独立同分布的中心极限定理，有： $\frac{k-m\pi_1}{\sqrt{m\pi_1(1-\pi_1)}}~\dot{\sim}~N(0,1)$
随之：
$\chi^2=\frac{(k-m\pi_1)^2}{m\pi_1(1-\pi_1)}=\frac{(k-m\pi_1)^2}{m\pi_1}+\frac{[(m-k)-m(1-\pi_1)]^2}{m(1-\pi_1)}\dot{\sim}\chi^2(1)$
同理可得：
$\chi^2=\frac{(l-n\pi_2)^2}{n\pi_2(1-\pi_2)}=\frac{(l-n\pi_2)^2}{n\pi_2}+\frac{[(n-l)-n(1-\pi_2)]^2}{n(1-\pi_2)}\dot{\sim}\chi^2(1)$
现在要检验药物1与药物2的药效是否相同，那么原假设与备择假设如下：
$H_0:\pi_1=\pi_2=\pi~~~~~~~~~H_1:\pi_1\neq\pi_2$
在原假设成立的条件下，有：
$\frac{(k-m\pi)^2}{m\pi(1-\pi)}+\frac{(l-n\pi)^2}{n\pi(1-\pi)}=(\frac{(k+l)-(m+n)\pi}{\sqrt{(m+n)\pi(1-\pi)}})^2\dot{\sim}\chi^2(1)$
所以可以这样构造 $\chi^2$ 统计量：
$\frac{(k-m\pi)^2}{m\pi}+\frac{[(m-k)-m(1-\pi)]^2}{m(1-\pi)}+\frac{(l-n\pi)^2}{n\pi}+\frac{[(n-l)-n(1-\pi)]^2}{n(1-\pi)}\dot{\sim}\chi^2(1)$

Emma_bbb

关注

4
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
卡方分布

若随机变量XXX服从参数为nnn的卡方分布 — χ2(n)\chi^2(n)χ2(n)，则它的密度函数是：p(x)=(12)n2Γ(n2)xn2−1e−x2p(x)=\frac{({\frac{1}{2})}^{\frac{n}{2}}}{\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}p(x)=Γ(2n)(21)2nx2n−1...
复制链接

扫一扫