概率论复习笔记（二）随机变量及其分布

最新推荐文章于 2023-11-24 16:17:22 发布

让步如故

最新推荐文章于 2023-11-24 16:17:22 发布

阅读量1.5k

点赞数 5

分类专栏：概率论与数理统计笔记文章标签：概率论

本文链接：https://blog.csdn.net/m0_45381924/article/details/107751728

版权

笔记同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

概率论与数理统计

6 篇文章 9 订阅

订阅专栏

概率论复习笔记（二）随机变量及其分布

基本概念
典型例题

基本概念

随机变量及其分布函数

随机变量：设随机试验 $E$ 的样本空间为 $\Omega$ ，如果对于 $\Omega$ 内的每一个样本点 $e$ 都有一个实数x 与之对应，则称 $X$ 为随机变量，记为 $X = X (e) .$

简言之，随机变量就是定义在样本空间 $\Omega$ 上的样本点 e 的实值单值函数 $X (e) .$ 我们一般用大写字母如 $X，Y，Z,\dots$ 表示随机变量。

随机变量的分类：
$\begin{cases} 离散型 \\ 非离散型 \begin{cases} 连续型 \\ 其他 \end{cases} \end{cases}$

不要误以为，一个随机变量如果不是离散型就是连续型的.实际上还存在非离散非连续型的。

随机变量的取值是有概率规律的，这种概率规律叫做随机变量的概率分布.在概率分布的描述上，离散型随机变量和连续型随机变量所采用的方法是不同的.前者主要采用列举法，后者主要采用积分法.

分布函数

设 $X$ 是一个随机变量 $, x$ 是任意实数，函数
$F(x)=P\{X\leq x\},-\infty<x<\infty$

称为 $X$ 的分布函数.

分布函数的性质

单调性: $F (x)$ 是一个单调不减的函数，即当 $x_1<x_2$ 时 $,F(x_1)\leq F(x_2);$
有界性 :
$0\leq F(x_1)\leq 1,且\\ F(+\infty)=\lim_{x\to+\infty}F(x)=1;\\ F(-\infty)=\lim_{x\to-\infty}F(x)=0;$
连续性: $F (x + 0) = F (x),$ 即 $F (x)$ 是右连续函数.

用分布函数表示概率:

$P\{X=a\}=P\{X\leq a\}-P\{X<a\}=F(a)-F(a-0)\\ P\{X>a\}=1-P\{X\leq a\}=1-F(a)\\ P\{a<X\leq b\}=P\{X\leq b\}-P\{X\leq a\}=F(b)-F(a)\\ P\{a<X<b\}=P\{X<b\}-P\{X\leq a\}=F(b-0)-F(a)\\ P\{a\leq X\leq b\}=P\{X\leq b\}-P\{X<a\}=F(b)-F(a-0)\\ P\{a\leq X<b\}=P\{X<b\}-P\{X<a\}=F(b-0)-F(a-0)\\$

离散型随机变量及其概率分布

离散型随机变量

若随机变量 $X$ 的全部可能取值是有限个或可列个，则称 $X$ 为离散型随机变量.

分布律

离散型随机变量 $X$ 所有可能取值为 $x_k(k=1,2,\cdots),$ 事件 ${X=x_k\}$ 的概率为 $P\{X=x_k\}=p_k(k=1,2,\cdots),$ 这里有 $0\leq p_k\leq 1,$ 并且 $\sum_kp_k=1$ 则称 $P\{X=x_k\}=p_k(k=1,2,\cdots)$ 为 $X$ 的分布律或分布列。

分布律也可以写成表格形式:

$X$	$x_1$	$x_2$	$\cdots$	$x_k$	$\cdots$
$P$	$p_1$	$p_2$	$\cdots$	$p_k$	$\cdots$

性质

离散型随机变量 x的分布律的性质：

$P\{X=x_k\}=p_k\geq0(k=1,2,\cdots)$
$\sum_kP\{X=x_k\}=\sum_kp_k=1$

离散型随机变量 $X$ 的分布律与分布函数和事件概率的关系

如果已知 $X$ 的分布律为 $P\{X=x_k\}=p_k(k=1,2,\cdots),$ 则 $X$ 的分布函数

$F(x)=P\{X\leq x\}=\sum_{x_k\leq x}p_k;$

而事件的概率为
$P\{a<X\leq b\}=\sum_{a<x_k\leq b}p_k.$

如果已知 $X$ 的分布函数 $F (x),$ 则 $X$ 的分布律为
$P\{X=x_k \}=F( x_ k ) — F ( x_ k — 0),k=1,2,\cdots,$

$F (x)$ 的值是 $X = x$ 点的左边(含 $x$ 点）全部所有点概率值的累加和.

$F (x)$ 的图形是右升的台阶形，每个台阶处的跃度等于 $X$ 取该值的概率.基于这点，由 $X$ 的分布函数的图形可以求出 $X$ 的分布律

几个重要的离散型随机变量

(0—1) 分布

设随机变量 X只可能取 0 与1 两个值，它的分布律是 $P\{X=k\}=p^k(1-p)^{1-k},k=0,1,0<p<1$

$X$	0	1
$p_k$	$1 - p$	$p$

(0 — 1) 分布是经常遇到的一种分布，用来描述只有两种对应结果的伯努利试验（如成功与失败，合格与不合格，出现与不出现等）.这些时候我们可以定义一个服从（0 — 1) 分布的随机变量:
$\begin{cases} 0,A不发生\\ 1,A发生 \end{cases}$

二项分布

伯努利试验

设试验 $E$ 只有两种可能结果,A 及 $\overline{A}$ ，则 $E$ 称为伯努利试验.若将试验 $E$ 独立地重复进行 $n$ 次，则称这个试验为 $n$ 重伯努利试验.

伯努利试验是一个很重要的数学模型.

二项分布

在 $n$ 重伯努利试验中,若 $p，P(\overline{A})= 1—p.$ 记X为 $n$ 次试验中事件A 发生的次数,显然 $X$ 是一个随机变量，它的取值为$ 0,1,2,\dots,n.$它的分布律为
$P\{X = k\}= C^k_np^k(1 —p)^{n-k} ，k = 0，1， 2， \dots,n,$
称 X服从参数为 $n, p$ 的二项分布,记为
$X\sim B(n,p)$

二项分布与(0 — 1)分布有着密切关系

在二项分布中，若 $n = 1,$ 二项分布就变成 (0 — 1) 分布；
在 $n$ 次伯努利试验中，若只考虑某一次试验，比如第 $i$ 次试验，可定义随机变量 $X_i$ 如下：
$X_i= \begin{cases} 1,当A_i发生时\\ 0,当\overline{A_i}发生时 \end{cases},i=1,2,\cdots,n,$

$X_i$ 服从（ 0 — 1) 分布. 对前面的 $X$ ,显然有 $X=\sum_{i=1}^{n}X_i.$ 而 $X$ 服从二项分布.所以说: $n$ 个服从(0-1)分布的且相互独立的随机变量 $X_i$ 的和服从二项分布.

二项分布分布律中概率的最大值问题

1.取 $k_0=[(n+1)p]，P\{X=k_0\}$ 为分布律中的最大值([ ]为取整记号).
2.若 $n+ 1)p=k_0$ 为整数，则 $P\{X = k0\}=P\{X=k_0-1\}$ 同为分布律中的最大值.

泊松分布

泊松分布的定义

对于常数 $\lambda>0$ ,如果随机变量 $X$ 的分布律为
$P\{X=k\}=\frac {\lambda^ke^k}{k!},k=0,1,2,\cdots,$
则称 $X$ 服从参数为 A 的泊松分布，记为 $X\sim B(\lambda)$ .

泊松定理

设有 $X\sim B(n,p_n)$ 和常数 $\lambda> 0,$ 如果 $np_n=\lambda,$ 则
$\lim_{n\to \infty} C^k_np^k_n(1-p_n)^{n-k}=\frac {\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots.$

①泊松定理说明,当 $n\to \infty$ 时,二项分布的极限分布为泊松分布.这从理论上说明了泊松分布的来源.

另一方面也表明，当 $n$ 很大很大时，二项分布可以用泊松分布近似代替.

实践中，对 $X\sim B(n,p)$ 的情况，当 $n\geq50,np\leq10$ 时,记 $\lambda=np.$ 则有
$C^k_np^k(1-p)^{n-k}\approx\frac {\lambda^ke^{-\lambda}}{k!}.$

② 具有泊松分布的随机变量在实际应用中是很多的，如一本书一页中的印刷错误字数、一段时间内电话用户对电话站的呼唤次数、电影院的观众数，等等. 泊松分布也是概率论中的一种重要分布.

超几何分布

超几何分布定义

$KaTeX parse error: No such environment: align at position 57: …{N}^{n}} \begin{̲a̲l̲i̲g̲n̲}̲ ,k=0,1,2,\cdot…$

随机变量 X 服从参数为$n， N，M $的超几何分布，记为$ X\sim H( n，N，M)$

超几何分布的含义

有 $N$ 个球，其中有 $M$ 个白球， $N — M$ 个黑球.从中取出 $n$ 个球，取到 $k$ 个白球的概率.

几何分布

几何分布定义

$\{ X = k \} = q^{k-1}p,k = 1,2,3，\cdots，$ 其中 $p\geq0,q=1-p.$ 随机变量 $X$ 服从参数为 $p$ 的几何分布，记为 $X\sim G(p).$

几何分布的背景

每次 A 发生的概率为 $p,$ 而直到第 $k$ 次才出现A.

连续型随机变量及其概率分布

连续型随机变量

如果对于随机变量 $X$ 的分布函数 $F (x),$ 存在非负函数 $f (x),$ 使对于任意实数 $x$ 有
$F(x)=\int_{-\infty}^{x}{f(t)dt},$
则称 $X$ 为连续型随机变量，其中函数 $f (x)$ 称为 $X$ 的概率密度函数，简称概率密度.

概率密度的性质

$f(x)\geq 0;$
$\int _{-\infty}^{+\infty}f(x)dx=1;$
对于任意实数 $x_1,x_2(x_1\leq x_2),$
$KaTeX parse error: No such environment: equation at position 23: …<X<x_2\} \begin{̲e̲q̲u̲a̲t̲i̲o̲n̲}̲ =F(x_2)-F(x_1)…$
$f (x)$ 若在点 $x$ 处连续，则有 $F^{'} (x) = f (x) .$

常见连续型随机变量

均匀分布

均匀分布定义

若连续型随机变量 $X$ 具有概率密度
$\begin{cases} \frac{1}{b-a}, \text{a<x< b} \\ 0, \text{其他，} \end{cases}$
则称 X 在区间 $(a, b)$ 上服从均匀分布. 记为 $X\sim U(a,b).$

$X$ 的分布函数为
$\begin{cases} 0, x<a，\\ \frac{1}{b-a},a\leq x< b,\\ 1, x\geq b \end{cases}$

均匀分布的性质

若 $(c,d)\subset(a,b),$ 则有
$P\{c\leq X\leq d\}=\frac{d-c}{b-a}(几何概率).$

指数分布

指数分布定义

若连续型随机变量 $X$ 的概率密度为
$\begin{cases} \lambda e^{-\lambda x}, x>0，\\ 0,x\leq 0.\\ \end{cases}$
其中 $\lambda>0$ 为常数，则称 $X$ 服从参数为 $\lambda$ 的指数分布.

$X$ 的分布函数为 $\begin{cases} 0, x>0，\\ 1-e^{-\lambda x},x\leq 0.\\ \end{cases}$

指数分布的性质(无记忆性）

若 $X\sim E(\lambda),$ 则对任何正数 $x,x_0,$ 必有
$P\{X>x+x_0\mid X>x_0\}=P\{X>x\}.$

指数分布常用作描述一些电子元件的使用寿命,当 $x > 0$ 时 $,P\{X>x\}=e^{-\lambda x}$

记住积分公式 $\int_{0}^{+\infty}{x^ne^{-x}dx}=n!$ 对指数分布的计算很有帮助，可能减少许多积分过程.

正态分布

正态分布定义

若连续型随机变量 $X$ 的概率密度函数为
$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}(-\infty<x<+\infty),$
其中的正态分布 $\mu$ 与 $\sigma>0$ 都是常数,则称服从参数为 $\mu$ 与 $\sigma$ 的正态分布.简记为$X\sim N(\mu,\sigma^2). $

正态分布的性质

$f (x)$ 的图形关于 $=\mu$ 对称;
当 $=\mu$ 时， $f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$ 为最大值.

$X$ 的分布函数为
$F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int _{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt.$

标准正态分布

当 $\mu=0,\sigma=1$ 时称随机变量 $X$ 服从标准正态分布.其概率密度和分布函数分别用 $\varphi(x),\Phi(x)$ 表示，即有
$\varphi(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{t^2}{2}},\\ \Phi(x)=\frac{1}{\sqrt{2\pi}\sigma}\int _{-\infty}^{x}e^{-\frac{t^2}{2}}dt.$

标准正态分布的性质

$\Phi(-x)=1-\Phi(x)$ 且 $\Phi(0)=\frac {1}{2}$ 此性质在计算和查表时都是很有用的.
若 $X\sim N(\mu,\sigma^2),$ 则 $Z=\frac{X-\mu}{\sigma}\sim N(0,1).$

$X$ 得到 $Z$ 这种做法叫正态分布的标准化步骤.解决正态分布的计算问题最重要的，首先要考虑的就是对 $X$ 进行标准化.
$X\sim N(\mu,\sigma^2),$ 则

$P\{a\leq X\leq b\}=\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma}).$

特例：
$P\{\mu-k\sigma\leq X\leq \mu+k\sigma\}\\ =\Phi(\frac{\mu+k\sigma-\mu}{\sigma})-\Phi(\frac{\mu-k\sigma-\mu}{\sigma})\\ =\Phi(k)-\Phi(-k)\\ =2\Phi(k)-1$

它的等价形式为
$P\{\mid X-\mu\mid\leq k\sigma\}=2\Phi(k)-1$
此概率值与 $\mu,\sigma$ 大小无关,只与 $k$ 的数值有关.

$k$	$P\{\mid X-\mu\mid\leq k\sigma\}$
1	0.6826
2	0.9544
3	0.9974

随机向量及其分布

二维随机变量

设 $E$ 是随机试验,样本空间为 $\Omega=\{e\}，$ 由 $X = X (e)$ 和 $Y = Y (e)$ 构成的一个向量$(X ， Y) $叫做二维随机变量。

联合分布

二维随机变量的联合分布函数

设 $(X, Y)$ 是二维随机变量 $, x, y$ 是两个任意实数,则称定义在平面上的二元函数 $P\{X\leq x,Y\leq y\}$ 为 $(X, Y)$ 的分布函数,或称为
$X$ 和 $Y$ 的联合分布函数,记作 $F (x, y),$ 即
$F(x,y)=P\{X\leq x,Y\leq y\}.$

$F (x, y)$ 的性质

$0\leq F(x,y)\leq 1,$ 且 $F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1$
$F (x, y)$ 是变量 $x$ 和 $y$ 的单调不减函数.
) $F (x, y) = F (x + 0, y), F (x, y) = F (x, y + 0),$ 即 $F (x, y)$ 关于 $x$ 和 $y$ 都是右连续的.
对任意 $x_1,y_1),(x_2,y_2),$ 当 $x_1<x_2,y_1<y_2$ 时有
$P\{x_1<X\leq x_2,y_1<Y\leq y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\geq0.$

联合分布律

若 $(X, Y)$ 所有可能取值为 $(x_i,y_j),i,j=1,2,\cdots.$ 则称 $(X, Y)$ 是离散型的随机变量.

称 $P\{X=x_i,Y=y_j\}=p_{ij},i,j=1,2,\cdots$ 为二维离散型随机变量 $(X, Y)$ 的分布律,或随机变量 $X$ 和 $Y$ 的联合分布律.
也能用表格来表示 $X$ 和 $Y$ 的联合分布律，如下表所示.

$Y / X$	$x_1$	$x_2$	$\cdots$	$x_i$	$\cdots$
$y_1$	$p_{11}$	$p_{21}$	$\cdots$	$p_{i1}$	$\cdots$
$y_2$	$p_{12}$	$p_{22}$	$\cdots$	$p_{i2}$	$\cdots$
$\cdots$	$\cdots$	$\cdots$		$\cdots$
$y_j$	$p_{1j}$	$p_{2j}$	$\cdots$	$p_{ij}$	$\cdots$
$\cdots$	$\cdots$	$\cdots$		$\cdots$

这里 $p_{ij}$ 具有下列性质：

$p_{ij}\geq 0(i,j=1,2,\cdots);$
$\sum_i\sum_jp_{ij}=1.$

$(X, Y)$ 的联合分布函数为
$F(x,y)=\sum_{x_i\leq x,y_j\leq y}P\{X=x_i,Y=y_j\}.$

联合概率密度

若存在非负的函数 $f (x, y)$ 使对任意有分布函数 $F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dudv,$ 则称 $(X, Y)$ 是连续型随机变量. $f (x, y)$ 称为 $(X, Y)$ 的联合概率密度.

联合密度的性质

$f(x,y)\geq0.$
$\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dydx=F(+\infty,+\infty)=1.$
若 $f (x, y)$ 在点 $(x, y)$ 处连续，则 $\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y).$
设 $G$ 是 $x O y$ 平面上一个区域,则
$P\{(X,Y)\in G\}=\iint_Gf(x,y)dxdy$

常见的二维随机变量的分布

二维均匀分布

如果二维随机变量 $(X, Y)$ 有概率密度
$\begin{cases} \frac{1}{A},(x,y)\in G,\\ 0,其他. \end{cases}$
其中 $G$ 为平面有界区域 $, A$ 为其面积,则称 $(X, Y)$ 在 $G$ 上服从二维均匀分布.

二维均匀分布的性质

在正矩形(矩形边与坐标轴平行)上,二维均匀分布的边缘分布是均匀分布,并且 $X$ 与 $Y$ 相互独立.

二维正态分布

如果二维随机变量 $(X, Y)$ 的概率密度为
$f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2 \sqrt{1-\rho^2}}exp\{-\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]\}(-\infty<x,y<+\infty),$
其中 $\mu_1,\mu_2,\sigma_1,\sigma_2,\rho$ 均为常数,且 $\sigma_1>0,\sigma_2>0,-1<\rho<1,$ 则称 $(X, Y)$ 服从参数为 $\mu_1,\mu_2,\sigma_1,\sigma_2,\rho$ 的二维正态分布,记作
$(X,Y)\sim N(\mu_1,\sigma_1^2;\mu_2,\sigma_2^2;\rho).$
特别,当 $\mu_1=\mu_2=0,\sigma_1=\sigma_2=1$ 时，则称 $(X, Y)$ 服从标准正态分布.

二维正态分布的性质

$(X,Y)\sim N(\mu_1,\sigma_1^2;\mu_2,\sigma_2^2;\rho)\Rightarrow X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)$

逆命题不成立.

边缘分布

边缘分布函数：

关于 $X$ 有:

$F_X(x)=P\{X\leq x\}=P\{X\leq x,Y<+\infty\};$

关于 $Y$ 有

$F_Y(y)=P\{Y\leq y\}=P\{X<+\infty,Y\leq y\};$

由联合分布函数 $F (x, y)$ 求边缘分布函数,有
$F_X(x)=F(x,+\infty)=\lim _{y\to+\infty}F(x,y),F_Y(y)=F(+\infty,y)=\lim _{x\to+\infty}F(x,y).$

离散型随机变量的边缘分布

边缘分布律

关于 $X$ 有:
$P\{X=x_i\}=\sum_jP\{X= x_i,Y=y_j\}=\sum_jp_ij=p_i\}$
关于 $Y$ 有
$P\{Y= y_j\}=\sum_iP\{X= x_i,Y=y_j\}=\sum_ip_ij=p_j\}$

边缘分布函数

关于 $X$ 有:
$F_X(x)=\sum_{x_i\leq x}p_i.$
关于 $Y$ 有:
$F_Y(y)=\sum_{y_i\leq y}p_j.$

连续型随机变量的边缘分布

设 $f (x, y)$ 为联合密度函数 .

边缘密度函数

关于 $X$ 有:
$f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy,$
关于 $Y$ 有:
$f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx.$

边缘分布函数

关于 $X$ 有:
$F_X(x)=\int_{-\infty}^{x}f_X(x)dx=\int_{-\infty}^{x}\int_{-\infty}^{+\infty}f(x,y)dydx,$
关于 $Y$ 有:
$F_Y(y)=\int_{-\infty}^{y}f_Y(y)dx=\int_{-\infty}^{y}\int_{-\infty}^{+\infty}f(x,y)dxdy.$

条件分布

离散型随机变量的条件分布律

设 $(X, Y)$ 是二维离散型随机变量，对于固定的 $j,$ 若 $P\{Y=y_j\}>0,$ 则称
$p_{X\mid Y}(i\mid j)=P\{X=x_i\mid Y=y_j\}=\frac {p_{ij}}{p_j}(i=1,2,\cdots)$
为在 ${Y=y_j\}$ 条件下随机变量 $X$ 的条件分布律.

同样，对于固定的 $i,$ 若 $P\{X=x_i\}>0,$ 则称
$p_{Y\mid X}(j\mid i)=P\{Y=y_j\mid X=x_i \}=\frac {p_{ij}}{p_i}(j=1,2,\cdots)$
为在 ${X=x_i\}$ 条件下随机变量 $Y$ 的条件分布律.

连续型随机变量的条件概率密度

设 $(X, Y)$ 是二维连续型随机变量,若 $f_Y(y)>0,$ 则称
$p_{X\mid Y}(x\mid y)=\frac {f(x,y)}{f_Y(y)}(-\infty<x<+\infty)$
为在 ${Y=y\}$ 条件下随机变量 $X$ 的条件概率密度.

若 $f_X(x)>0,$ 则称
$p_{Y\mid X}(y\mid x)=\frac {f(x,y)}{f_X(x)}(-\infty<y<+\infty)$
为在 ${X=x\}$ 条件下随机变量 $Y$ 的条件概率密度.

随机变量的独立性

二维随机变量的独立性

若对任何都有 $P\{X\leq x,Y\leq y\} = P\{X\leq x\}P\{Y\leq y\},$ 即 $F( x , y ) = F_X( x )F_Y ( y ) ,$ 则称随机变量 $X$ 和 $Y$ 是相互独立的.

独立性的判断方法：
(1) 用分布函数:

$X, Y$ 相互独立的充分必要条件是在任何点 $(x, y)$ 都有 $F( x , y ) = F_X( x )F_Y ( y ) ;$
(2) 对离散型随机变量:

$X, Y$ 相互独立的充分必要条件是对所有的 $i, j,$ 都有 $P\{X=x_i,Y=y_j\}=P\{X=x_i\}P\{Y=y_j\};$
(3) 对连续型随机变量:

$X, Y$ 相互独立的充分必要条件是对任何点 $(x, y)$ 都有 $f ( x , y ) = f_X( x ) f_Y ( y ) .$

多维随机变量的分布

联合分布函数为
$F(x_1,x_2,\cdots,x_n)=P\{X_1\leq x_1,X_2\leq x_2,\cdots,X_n\leq x_n\}.$
边缘分布函数为
$F_{X_i}(x_i)=P\{X_i\leq x_i\}=F(+\infty,+\infty,\cdots,x_i,\cdots,+\infty,+\infty),(i=1,2,\cdots,n).$

多维随机变量的独立性

若对所有 $x_1,x_2,\cdots,x_n$ 都有
$P\{X_1\leq x_1,X_2\leq x_2,\cdots,X_n\leq x_n\}=P\{X_1\leq x_1\}\cdots P\{X_n\leq x_n\},$
则称 $X_1,X_2,\cdots,X_n$ 是相互独立的.

$X_1,X_2,\cdots,X_n$ 相互独立的判断条件:

$X_1,X_2,\cdots,X_n$ 相互独立的充分必要条件是

$F(x_1,x_2,\cdots,x_n)=F(x_1)F(x_2)\cdots F(x_n).$
对离散型随机变量: $X_1,X_2,\cdots,X_n$ 相互独立的充分必要条件是

$P\{X_1=x_1,X_2=x_2,\cdots,X_n=x_n\}=P\{X_1=x_1\}\cdots P\{X_n=x_n\}$
对连续型随机变量: $X_1,X_2,\cdots,X_n$ 相互独立的充分必要条件是

$f(x_1,x_2,\cdots,x_n)=f_{X_1}(x_1)f_{X_2}(x_2)\cdot f_{X_n}(x_n).$

随机变量的函数的分布

这里要解决的问题是：已知随机变量 $X$ 的分布 $, Y = g (X), g$ 是连续函数,求随机变量 $Y$ 的分布.

离散型随机变量函数的分布

设随机变量 X 的分布律为 $P\{X=x_k\}=p_k,k=1,2,\cdots,$ 则当 $Y = g (X)$ 的所有取值为: $y_j(j=1,2,\cdots)$ 时, 随机变量 $Y$ 有分布律
$P\{Y=y_j\}=\sum_{g(x_i)=y_j}P\{X=x_i\}.$

连续型随机变量函数的分布

分布函数法

设随机 $X$ 的慨率密度函数为 $f_X(x)(-\infty<x<+\infty),$ 那么 $Y = g (X)$ 的分布函数为
$F_Y(y)=P\{Y\leq y\}=P\{g(X)\leq y\}=\int_{g(x)\leq y}{f_X(x)dx},$
其概率密度为 $f_Y(y)=F'_Y(y).$

公式法

设随机变量 $X$ 具有概率密度函数 $f_X(x)(-\infty<x<+\infty),g(x)$ 为 $(-\infty<x<+\infty)$ 内的严格单调的可导函数,则随机变量 $Y = g (X)$ 的概率密度为
$f_Y(y)= \begin{cases} f_X[h(y)]\mid h'(y)\mid,\alpha<y<\beta\\ 0,其他.\\ \end{cases}$
其中 $h (y)$ 是 $g (x)$ 的反函数,
$\alpha=min\{g(-\infty),g(+\infty)\},\\ \beta=max\{g(-\infty),g(+\infty)\}$
其分布函数为 $F_Y(y)=\int^{y}_{-\infty}{f_Y(t)dt}.$

两个随机变量的函数的分布

设 $(X, Y)$ 为二维随机变量, $z = g (x, y)$ 为连续函数,则称 $Z = g (X, Y)$ 为二维随机变量 $(X, Y)$ 的函数.

显然 $Z$ 为一维随机变量,其分布函数为 $F_{Z}(z)=P\{Z\leq z\}=P\{g(X,Y)\leq z\}$
若 $(X, Y)$ 为二维连续型随机变量,设其分布密度为 $f (x, y)$ 则 $Z$ 的分布函数可表示为

$F_{Z}(z)=P\{Z\leq z\}=\iint_{g(x,y)\leq z}f(x,y)dxdy,$
由此得 $Z$ 的分布密度为
$f_Z(z)=\frac{dF_Z(z)}{dz}=\frac{d}{dz}\iint_{g(x,y)\leq z}f(x,y)dxdy.$

$Z = X + Y$ 的分布

根据定义计算

$F_{Z}(z)=P\{Z\leq z\}=P\{X+Y\leq z\}$

分三种情况计算

$X, Y$ 是离散型:直接计算 Z 的分布律；
$X, Y$ 是连续型:利用定义计算 Z 的分布函数和分布密度,或根据 $f_Z(z)$ 作一重积分计算：
$f_Z(z)=\int_{-\infty}^{+\infty}{f(x,z-x)dx}.$
特别，当 $X$ 与 $Y$ 相互独立时,
$f_Z(z)=f_X*f_Y=\int_{-\infty}^{+\infty}{f_X(x)·f_Y(z-x)dx}=\int_{-\infty}^{+\infty}{f_X(z-y)·f_Y(y)dx}(卷积公式).$
X 是离散型， Y 是连续型:使用全概率公式.

关于正态分布的结论

两个独立的正态分布的仍为正态分布,即若 $X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)$ 则 $Z=X+Y\sim N(\mu_1+\mu_2,\sigma_1^2+\sigma_2^2).$

典型例题

一维随机变量的分布函数

在这里插入图片描述

一维离散型随机变量的计算

二项分布与超几何分布

袋中装有6个大小相同的球,4个红色,2个白色.现从中连取5次,每次取一球，求取得红球的个数X的分布律:
(1)每次取出球观察颜色后，即放回袋中,拌匀后再取下一个球;
(2)每次取出球观察颜色后,不放回袋中,再取下一个球.

解:

(1) 随机变量X服从二项分布，则 $X\sim (5,\frac{2}{3})$ 故
$P\{X = k\}= C^k_5(\frac{2}{3})^k(\frac{1}{3})^{5-k} ，k = 0，1， 2，3,4,5,$
因此X的分布律为

$X$	0	1	2	3	4	5
$p_k$	$\frac{1}{243}$	$\frac{10}{243}$	$\frac{40}{243}$	$\frac{80}{243}$	$\frac{80}{243}$	$\frac{32}{243}$

(2)随机变量 $X$ 服从超几何分布,故
$P\{X=k\}=\frac {C_4^k·C_{6-4}^{5-k}}{C _{6}^{5}},k=3,4$
因此 $X$ 的分布律为

$X$	3	4
$p_k$	$\frac{2}{3}$	$\frac{1}{3}$

几何分布

一房间有3扇同样大小的窗子,其中只有一扇是打开的，有一只鸟自开着的窗子飞入房间，它只能从开着的窗子飞出去。鸟在房子里飞来飞去,试图飞出房间。鸟飞向各扇窗子都是随机的。
(1)假定鸟是没有记忆的，以X表示鸟为了飞出房间试飞的次数,求X的分布律;
(2)户主称,他养的鸟是有记忆的,它飞向任一窗子的尝试不多于一次，以Y表示这只聪明的鸟为了飞出房间试飞的次数，如户主所说是确实的，试求Y的分布律.
解：

(1) X服从几何分布,每次只能从开着的窗子飞出去，飞出去的概率为 $\frac{1}{3}，$ 因此 $X$ 的分布律为
$\{ X = k \} = (\frac{2}{3})^{k-1}\frac{1}{3}(k = 1,2,\cdots).$
(2)当鸟是有记忆的时,由题意,Y的可能取值为1,2.3.
Y=1,表明鸟从3扇窗子中选对了1扇,因对鸟面言.3扇窗是等可能的 $,P\{Y=1\}=\frac{1}{3}$
Y=2,表明鸟第1次试飞失败概率为 $\frac{2}{3},$ 第二次，鸟舍弃已飞过的那扇窗，而从余下的一开一关两扇窗中选一，成功机会为 $\frac{1}{2}$ ,故 $P\{Y=2\}=\frac{2}{3}\times\frac{1}{2}=\frac{1}{3}$
Y=3,表明鸟第1次试飞失败概率为 $\frac{2}{3},$ 第二次，鸟舍弃已飞过的那扇窗，而从余下的一开一关两扇窗中选一，失败机会为 $\frac{1}{2}$ ,第三次从剩下的唯开着的窗子飞出，成功的概率为1.故 $P\{Y=3\}=\frac{2}{3}\times\frac{1}{2}\times1=\frac{1}{3}$
因此Y的分布律为

Y	1	2	3
$p_k$	$\frac{1}{3}$	$\frac{1}{3}$	$\frac{1}{3}$

泊松分布

由商店过去的销售记录知道，某商品每月的销售数可以用参数λ=10的泊松分布来描述，为了以95%以上的把握保证不脱销，问商店在上一个月底至少应进某种商品多少件?
解：

设该商店每月销售某种商品X件,X服从参数λ= 10的泊松分布,故

$P\{X=k\}=\frac {10 ^ke^k}{k!},k=0,1,2,\cdots,$
设月底的进货为a件，则当 $X\leq a$ 时就不会脱销,因而按题意要求为 $P\{X\leq a\}\geq 0.95,$
即
$\sum_{k=0}^{a}\frac {10 ^ke^{-10}}{k!}>0.95,$
由泊松分布表可得
$\sum_{k=0}^{14}\frac {10 ^ke^{-10}}{k!}\approx 0.9166<0.95,\\ \sum_{k=0}^{15}\frac {10 ^ke^{-10}}{k!}\approx 0.9513>0.95.$
于是,这家商店只要在月底进货某种商品15件(假定上个月没存货),就可以95%以上的把握保证这种商品在下个月内不脱销.

一维连续型随机变量的计算

均匀分布

设X在[2,5]上服从均匀分布，求X的取值小于3的概率。

总长度：3

小于3的长度：1

$P_{(X的取值小于3)}$ = $\frac{1}{3}$

指数分布

某种电子元件的使用寿命X (单位:小时)服从 $\lambda=1/2000$ 的指数分布。
求：(1)一个元件能正常使用1000小时以上的概率；
(2)一个元件能正常使用1000小时到2000小时之间的概率。
在这里插入图片描述

正态分布

在这里插入图片描述

一维随机变量函数的分布

公式法

在这里插入图片描述

分布函数法

在这里插入图片描述

让步如故

关注

5
点赞
踩
22

收藏

觉得还不错? 一键收藏
3
评论
概率论复习笔记（二）随机变量及其分布

概率论复习（二）随机变量及其分布.md基本概念随机变量离散型随机变量离散型随机变量分布律性质几个重要的离散型随机变量(0—1) 分布二项分布伯努利试验二项分布二项分布与(0 — 1)分布有着密切关系泊松分布泊松分布的定义泊松定理超几何分布超几何分布定义超几何分布的含义几何分布几何分布定义几何分布的背景随机变量的分布函数分布函数分布函数的性质用分布函数表示概率:离散型随机变量XXX的分布律与分布函数和事件概率的关系连续型随机变量及其概率密度连续型随机变量概率密度的性质常见连续型随机变量均匀分布均匀分布定义均匀
复制链接

扫一扫