随机事件与随机变量

最新推荐文章于 2020-06-30 16:25:36 发布

遗忘了伤痛的少年

最新推荐文章于 2020-06-30 16:25:36 发布

阅读量771

点赞数

分类专栏：随机事件随机变量文章标签：统计学

本文链接：https://blog.csdn.net/Mark_Jiang233/article/details/106883445

版权

随机事件同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

随机变量

1 篇文章 0 订阅

订阅专栏

一、随机事件与随机变量

随机事件
随机变量

随机事件

1 定义

随机事件需满足以下三个条件：

可以在相同条件下重复进行；
结果有多种可能性，并且所有可能结果事先已知；
做一次试验究竟哪个结果出现，事先不能确定。

2 随机事件的概率

随机事件的概率主要有以下性质：

1 对于任一事件A，均有 $P(\bar{A})=1−P(A)$ .

2 对于两个事件A和B，若 $A \subset B$ ，则有

$P (B - A) = P (B) - P (A), P (B) > P (A)$ .

3 对于任意两个事件A和B，有

$P (A \cup B) = P (A) + P (B) - P (A \cap B)$ .

3 古典概型

我们将掷骰子游戏进行推广，设随机事件 E 的样本空间中只有有限个样本点，即 $Ω=\{ω1,ω2,...,ωn\}$ ，其中， n 为样本点的总数。每个样本点 $ω i (i = 1, 2, . . ., n)$ 出现是等可能的，并且每次试验有且仅有一个样本点发生，则称这类现象为古典概型。

例：求 k 个同班同学没有两人生日相同的概率。
解：设 $A$ = k 个同班同学没有两人生日相同
$\frac {C^k_lk！} {l^k} = \frac {l！} {l^k（l-k）!}, l=365$

Python代码实现，设 $k = 40$

#我们采用函数的递归的方法计算阶乘：
def factorial(n):
    if n == 0:
        return 1;
    else:
        return (n*factorial(n-1)) 
    
l_fac = factorial(365);          #l的阶乘
l_k_fac = factorial(365-40)      #l-k的阶乘
l_k_exp = 365**40                #l的k次方

P_B =  l_fac /(l_k_fac * l_k_exp)     #P(B）
print("事件B的概率为：",P_B)
print("40个同学中至少两个人同一天过生日的概率是：",1 - P_B)

4 条件概率

定义：
设 A 和 B 是两个事件，且 $P (B) > 0$ ，称 $\frac {P(AB)} {P(B)}$ 为在事件 B 发生的条件下，事件 A 发生的概率。
可以得到： $P (A B) = P (B ∣ A) P (A) = P (A ∣ B) P (B)$

5 全概率公式和贝叶斯公式

5.1 全概率公式

设 $B_1,B_2,...$ 是样本空间 $\Omega$ 的一个划分， $A$ 为任一事件，则

$\sum_{i=1}^{\infty } {P(B_i)}P(A|B_i)$

称为全概率公式。

5.2 贝叶斯公式

设 $B_1,B_2,...$ 是样本空间 $\Omega$ 的一个划分，则对任一事件 $A (P (A) > 0)$ ,有
$P(B_i|A) =\frac {P(B_i A)} {P(A)} = \frac {P(A|B_i )P(B_i)} {\sum_{j=1}^{\infty }P( B_j)P(A|B_j)} ,i=1,2,...$
称上式为贝叶斯公式，称 $P(B_i)(i=1,2,...)$ 为先验概率， $P(B_i|A)（i=1,2,...）$ 为后验概率。

注：贝叶斯公式也是在机器学习中朴素贝叶斯的核心，非常重要！

例：假定用血清甲胎蛋白法诊断肝癌。用 $C$ 表示被检验者有肝癌这一事件，用 $A$ 表示被检验者为阳性反应这一事件。当前有肝癌的患者被检测呈阳性反应的概率为0.95。即 $P (A ∣ C) = 0.95$ 。当前非肝癌的患者被检测呈阴性反应的概率为0.9。即 $P(\overline {A}|\overline {C}) = 0.90$ 。若某人群中肝癌患者概率为0.0004，即 $P (C) = 0.0004$ ，现在有一人呈阳性反应，求此人确为肝癌患者的概率是多少？

解：
$P(C)P(A|C)+P(\overline {C} )P(A|\overline {C})$

$=\frac {P(C)P(A|C)} {P(A)}=\frac {P(C)P(A|C)} {P(C)P(A|C)+P(\overline {C} )P(A|\overline {C})} =\frac {0.0004*0.95}{0.00040.95 + 0.9996*0.1} =0.0038$

随机变量

1 定义

设 $E$ 是随机试验， $\Omega$ 是样本空间，如果对于每一个 $\omega \in \Omega$ 。都有一个确定的实数 $X(\omega)$ 与之对应，若对于任意实 $\in R$ , 有 ${\omega ：X(\omega) < x } \in F$ ，则称 $\Omega$ 上的单值实函数 $X(\omega)$ 为一个随机变量。

• 随机变量的分布函数定义：

设 $X$ 是一个随机变量，对任意的实数 $x$ ，令 $\{X<=x\} ,x \in (- \infty ,+ \infty)$ 则称 $F (x)$ 为随机变量 $x$ 的分布函数，也称为概率累积函数。

2 离散型随机变量和二项分布

2.1 离散型随机变量

如果随机变量 $X$ 的全部可能取值只有有限多个或可列无穷多个，则称 $X$ 为离散型随机变量。掷骰子的结果就是离散型随机变量。
我们可以用下表来表示分布律：

$X$	$x_1$	$x_2$	…	$x_n$	…
$p_k$	$p_1$	$p_2$	…	$p_n$	…

离散型随机变量的分布函数为： $=\sum_{x_k <=x}{ P { (X=x_k )} } = \sum_{x_k <=x}{ P_k}$

2.2 二项分布

从一批产品中检验次品，在其中进行有放回抽样 $n$ 次，抽到次品称为“成功”，抽到正品称为“失败“，这就是 $n$ 重Bernoulli试验。

设 $A =\{ n重伯努利试验中A出现k次\}$ 则 $P(A_k） =C^k_np^k(1-p)^{n-k},k=0,1,2,...n.$ 这就是著名的二项分布，常记作 $B (n ， k ）$ 。

其分布函数为：
$\sum_{k=}^{[x]} {C^k_np^k(1-p)^{n-k}},k=0,1,2,...n.$ 其中， $[x]$ 表示下取整，即不超过 $x$ 的最大整数。

3 随机变量的数字特征

3.1 期望

离散型: 设离散型随机变量 $X$ 的分布律为 $P { X=x_i} = p_i ,i =1，2，...，$ 若级数 $ \sum_{i} {|x_i|p_i}$ 收敛，

（收敛指会聚于一点，向某一值靠近，相对于发散）。则称级数 $\sum_{i} {x_ip_i}$ 的和为随机变量 $X$ 的数学期望。记为 $E (X)$ ,即：

$\sum_{i} {x_ip_i}$

连续型：设连续型随机变量 $X$ 的概率密度函数为 $f (x)$ ,若积分 $\int_{- \infty}^{+ \infty}{|x|f（x）}dx$ 收敛，称积分 $\int_{- \infty}^{+ \infty}{xf（x）}dx$ 的值为随机变量 $X$ 的数学期望，记为 $E (X)$ ,即： $\int_{- \infty}^{+ \infty}{xf（x）}dx$
$E (X)$ 又称为均值。
数学期望代表了随机变量取值的平均值，是一个重要的数字特征。数学期望具有如下性质：