概率论与数理统计：概率论基础_概率论与数理统计 p-CSDN博客

本文链接：https://blog.csdn.net/sinat_34072381/article/details/82827221

1. 一维随机变量

1.1 离散型随机变量

概率函数

设 $X$ 为离散型随机变量，其全部可能值为 $\{a_1,a_2,\cdots\}$ ，则：
$P(X=a_i)=p_i\quad(i=1,2,\cdots, \,\, p_i\geq0, \,\, p_1+p_2+\cdots=1)$

称为 $X$ 的概率函数。

分布函数

设 $X$ 为一随机变量，则函数
$\leq x) \quad(-\infin<x<\infin)$

称为 $X$ 的分布函数。

性质：
$\quad\quad 1^。$ $F (x)$ 非递降函数，当 $x_1<x_2$ 时， $F(x_1)<F(x_2)$ ；

$\quad\quad 2^。$ 当 $\rightarrow \infin$ 时， $\rightarrow 1$ ；当 $\rightarrow -\infin$ 时， $\rightarrow 0$ ;

常见分布

二项分布： $\sim B(n,p)$
$P(X=k)=C_n^kp^k(1-p)^{n-k} \quad (i=0,1,\cdots,n)$
泊松分布： $\sim P(\lambda)$
$P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda} \quad(k=0,1,\cdots)$
适用于 $X$ 表示一定的时间或空间内事件发生的个数的场合。
二项分布与泊松分布关系
若 $\sim B(n,\lambda /n)$ ，则：
$P(X=k)=C_n^k(\frac{\lambda}{n})^k(1-\frac{\lambda}{n})^{n-k}$
当 $\rightarrow \infin$ 且 $\lambda /n \rightarrow 0$ 时，有:
$\lim_{n\rightarrow \infin}\frac{C_n^k}{n^k}=\frac{1}{k!},\quad\lim_{n\rightarrow \infin}(1-\frac{\lambda}{n})^n = e^{-\lambda}$
故特殊条件下的二项分布近似等于泊松分布。

1.2 连续型随机变量

密度函数

设连续型随机变量 $X$ 有概率分布函数 $F (x)$ ,则函数
$f (x) = F^{'} (x)$

称为 $X$ 的概率密度函数，它反映了概率在 $x$ 点处的密集程度。

性质：
$\quad\quad 1^。$ $f(x)\geq0$ ；

$\quad\quad 2^。$ $\int_{-\infin}^{\infin}f(x)dx=1$ ；

$\quad\quad 3^。$ $F(x)=\int_{-\infin}^xf(t)dt$ ；

$\quad\quad 4^。$ 对任何常数 $a < b$ ，有 $P(a\leq X \leq b)=F(b)-F(a)=\int_a^bf(x)dx$ ；

图1. 概率分布函数（左）与概率密度函数（右）

常见分布

正太分布： $\sim N(\mu,\sigma^2)$
$f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-{(x-\mu)^2}/2\sigma^2} \quad(-\infin < x < \infin)$
当 $\mu=0,\sigma^2=1$ 时 $\sim N(0,1)$ ，称为标准正太分布，记其密度函数和分布函数分别为 $\varphi(x)$ 和 $\varPhi(x)$ ，则
$\varphi(x)=\frac{1}{\sqrt {2\pi}}e^{-x^2/2}$
若 $\sim N(\mu,\sigma^2)$ ，则 $Y=(X-\mu)/\sigma\sim N(0,1)$

性质：
$\quad\quad 1^。$ $\varPhi(x)+\varPhi(-x)=1$ ；
指数分布
$\begin{aligned} & f(n)= \begin{cases} \lambda e^{-\lambda x},\quad x>0\\ 0, \quad\quad\quad x\leq0 \end{cases} \\\\ & F(x)=\int_{-\infin}^xf(t)dt= \begin{cases} 1-e^{-\lambda x},\quad &x>0\\ 0, \quad\quad\quad\quad &x\leq0 \end{cases} \end{aligned}$
适用于无老化的寿命分布场合， $\lambda$ 为失效率，失效率越高，寿命越短。
均匀分布： $\sim R(a,b)$
设随机变量 $X$ 有概率密度函数
$\begin{cases} \begin{aligned} 1/(b-a), \quad & a \leq x\leq b \\ 0, \quad\quad\quad\quad &其他 \end{aligned} \end{cases}$
称 $X$ 服从区间 $[a, b]$ 上的均匀分布。

均匀分布 $R (a, b)$ 的分布函数为：
$\begin{cases} 0, & \text x\leq a \\ (x-a)/(b-a), &\text a<x<b\\ 1,& \text x\geq b \end{cases}$

2. 多维随机变量

离散型概率函数

以 $\{a_{i1},a_{i2},\cdots \}$ 记为 $X_i$ 的全部可能值 $(i=1,2,\cdots)$ ，则事件 $\{X_1=a_{1j_1},\cdots,X_n=a_{nj_1}\}$ 的概率
$p(j_1,\cdots,j_n)=P(X_1=a_{1j_1},\cdots,X_n=a_{nj_n}) \quad (j_1=1,2,\cdots;\cdots;j_n=1,2,\cdots)$

称为随机变量 $X=(X_1,\cdots,X_n)$ 的概率函数或概率分布，且概率函数满足条件
$p(j_1,\cdots,j_n) \geq 0, \quad \sum_{j_n} \cdots \sum_{j_2} \sum_{j_1}p(j_1,\cdots,j_n)=1$

如上表中 $X_1$ 的可能值为 ${-1, 0, 5\}$ ， $X_2$ 的可能值为 ${1， 3\}$ ，则
$1)=P(X_1=a_{11}=-1, X_2=a_{21}=1)=0.17 \\\,\\P(3, 2)=P(X_1=a_{13}=5, X_2=a_{22}=3)=0.25$

连续型(概率)密度函数

若 $f(x_1, \cdots, x_n)$ 是定义在 $R^n$ 上的非负函数，是对 $R^n$ 中的任何集合 $A$ ，有
$\in A = \int \cdots \int f(x_1, \cdots,x_2)dx_1\cdots dx_n$
称 $f$ 是 $X$ 的（概率）密度函数。

分布函数

$F(x_1, x_2, \cdots, x_n) =P(X_1 \leq x_1, X_2 \leq x_2, \cdots, X_n \leq x_n)$

边缘分布

设 $X=(X_1,\cdots,X_n)$ 为一个 $n$ 维随机向量， $X$ 的分布为 $F$ ( $n$ 维)。对于 $X$ 的每个分量 $X_i$ ，其为一维随机变量且具有一定的分布 $F_i$ ，称 $F_i$ 为随机向量 $X$ 或其分布 $F$ 的边缘分布。
$P(X_1=a_{1k})=\sum_{j_2,\cdots,j_n} p(k,j_2,\cdots,j_n), \quad (k=1,2, \cdots)$
如上表1中 $X_1=\{a_{11}, a_{12}, a_{13}\}=\{-1,0,5\}$ ，因此
$\begin{aligned} P(X_1=0) &=P(X_1=a_{12})\\ &=p(2,1)+p(2,2) \\ &=P(X_1=0,X_2=1) + P(X_1=0,X_2=3) \\ &= 0.05+0.28=0.33 \end{aligned}$

边缘密度

设 $X=(X_1,X_2)$ 有概率密度函数 $f(x_1,x_2)$ ，则 $X_1$ 的分布函数为 $F_1(x_1)=P(X_1\leq x_1)$ ，等价于 $P(X_1\leq x_1, X_2 \leq \infin)$ ，即
$F_1(x_1)=P(X_1 \leq x_1)=\int_{-\infin}^{x_1}dt_1 \int_{-\infin}^\infin f(t_1,t_2)dt_2$
$\int_{-\infin}^\infin f(t_1,t_2)dt_2$ 是 $t_1$ 的函数，记为 $f_1(t_1)$ ，则
$F_1(x_1)=\int_{-\infin}^{x_1}f_1(t_1)dt_1 \implies dF_1(x_1)/dx_1=f_1(x_1)=\int_{-\infin}^\infin f(x_1,x_2)dx_2$
推广至 $X=(X_1,\cdots,X_n)$ ，即
$f_1(x_1)=\int_{-\infin}^\infin\cdots\int_{-\infin}^\infin f(x_1,\cdots,x_n)dx_2 \cdots dx_n$

离散条件概率分布

设二维随机变量 $X=(X_1,X_2)$ ， $X_1,X_2)$ 的联合概率分布为
$p_{ij}=P(X_1=a_i,X_2=b_j), \quad (i,j=1,2,\cdots)$
而
$P(X_1=a_i|X_2=b_j)=P(X_1=a_i,X_2=b_j)/P(X_2=b_j)=p_{ij} / \sum_k p_{kj} , \quad (i,j=1,2,\cdots)$

如表1中 $P(X_2=3|X_1=0)=0.28/0.33=0.848$

连续型随机变量分布

设二维随机变量 $X=(X_1.X_2)$ 有概率密度函数 $f(x_1,x_2)$ ，则
$\begin{aligned} P(X_1 \leq x_1 | a \leq X_2 \leq b) & = P(X_1 \leq x_1, a \leq X_2 \leq b)/P(a \leq X_2 \leq b) \\ & = \int_{-\infin}^{x_1}dt_1 \int_a^bf(t_1,t_2)dt_2 {\large/} \int_a^bf_25(t_2)dt_2 \end{aligned}$