概率统计第一章打卡学习

最新推荐文章于 2021-11-03 16:56:34 发布

laozhujie

最新推荐文章于 2021-11-03 16:56:34 发布

阅读量764

点赞数

本文链接：https://blog.csdn.net/laozhujie/article/details/106881163

版权

随机事件

1.1 基本概念

随机现象
对事件得结果不能完全预测得现象，称之为随机现象
随机试验
观察随机现象实现得过程，称为随机试验。记为E

条件：
1 可以在相同条件下重复进行
2 结果有多种可能性，并且所有可能的结果事先已知
3 作一次试验究竟哪个结果出现，事先不能确定
**
样本空间**
包含随机实验中所有可能的集合为样本空间，记为 $\Omega$

样本点
实验的每一可能结果称为样本点，记为 $\omega$

随机事件
在样本空间中满足一定条件的子集为随机事件，用大写字母 A,B，B

note: 随机事件在随机实验中可能出现也可能不出现

必然事件
在试验中，称一个事件发生是指构成该事件的一个样本点出现，由于样本空间 $\Omega$ 包含所有样本点，所以在每次实验中，它总发生，因此称 $\Omega$ 为必然事件

不肯能事件
空集 $\phi$ 不包含任何样本点，且在每次实验中总部发生

理解
其实这里的一些基本概念可以理解为一个集合
1 全集为样本空间，其中每一个元素都代表个样本点，而全集和子集的关系，就是随机事件发生的概率问题，全集因为包含所有的样本点，所以它一定是可能发生，空集则相反，他与任何子集的交集都是空集，所以一定是不可能发生的称为不可能事件

1.2 概率

1 定义
在随机实验中，每个随机事件的发生在整个样本空间中都有对应的实数P(A)与之相对应

理解
我一直的看法就是概率其实就是每个随机事件在整个样本空间中所占的比例，也就是子集子集在全集中所占的比例

特点
1 对于每个事件 $A$ ,均有 $0<P\langle A \rangle<=1$
2 $P\langle\Omega\rangle=1$
3 若事件 $A_1,A_2,A_3$ 两两互斥，（互斥的意思是在整个样本空间中任意两个互斥事件不可能同时发生，也就是说任意两个子集之间没有交集）
则有 $P\langle A_1 \bigcap A_2 \bigcap A_3\rangle= P\langle A_1 \rangle+P\langle A_2 \rangle.....$

主要性质
1 对于任一事件A，均有 $P\langle \bar{A} \rangle =1-P\langle A \rangle$

2 若事件A B 是包含的关系，即A $\sub$ B,则有

$P\langle B-A) =P(B)-P(A),P(B)>P(A)$
1 对于任意两个事件A和B，有
$\cup B ) = P(A)+P(B)-P(A \cap B)$

1.3 古典概型

古典概型的特点在于
1 样本空间有限
2 每个样本点出现是等可能的，且每次实验有且仅有一个样本点发生

公式这里定义事件A 它包含了m个样本点则事件A出现的概率为：
$\frac m n（n为事件所有样本点） )$

古典概型的推广
在学习中主要涉及到的是古典概型中的排列组合问题，但在实际的应用中可能结果打出人们所意料的，比如资料中所提及的生日问题

#递归方程
def recursion(n)
	if n== 0:
		return 1;
	else
		return (n*recursion(n-1))
		
l_fac = recursion(365)
l_k_fac = recursion(365 - 40)
l_k_exp = 365**40  #365的40次方

p_B = l_fac/（l_k_fac * l_k_exp）
print("事件B的概率为："，p_B)
print("40个同学中至少两个人同一天过生日的概率是："，1-p_B)

1.4 条件概率

1 定义
设A和B是两个事件，且 $P (B) > 0$ , 称为 $P(A|B)=\frac {P(AB)} {P(A)}$ 为在事件B发生的条件下，事件A发生的概率

全概率公式和贝叶斯公式

1 概率乘法公式：
$P (A B) = P (B ∣ A) P (A) = P (A ∣ B) P (B)$

2事件组，满足
1 $B_1,B_2,......$ 两两互斥，即 $B_i \cap B_j = \phi i和j不相等，$ 且 $P(B_i)>0$
2 $B_i \cup B_2 .... = \Omega$
则称事件组 $B_1 B_2........$ 是样本空间 $\Omega$ 的一个划分

全概率公式
设 $B_1 ,B_2$ 是样本空间 $\Omega$ 的一个划分，A为任意事件，则 $P(A)=\textstyle\sum_{i=1}^\infty P(B_i)P(A|B_i)$

2贝叶斯公式
设 $B_1 B_2 ........$ 是样本空间 $\Omega$ 的一个划分，则对任一事件 $A (P (A) > 0)$
$P(B_i|A)= \frac {P(B_iA)} {P(A)}=\frac {P(B_i)P(A|B_i)} {\textstyle\sum_{i=1}^\infty P(B_i)P(A|B_i)}$
上述称为贝叶斯公式
$P(B_i)为先验概率，P(B_i|A)为后验概率$
理解
在资料的理解中它给出了一个阳性条件下为肝癌的机率，这就意味着，如果使用条件概率，就是阳性患者还是肝癌的概率/阳性患者但有的时候阳性患者的概率未知时候，则可根据贝叶斯公式，求解阳性条件下是肝癌的加上阳性条件下不是肝癌的，这样就得到了阳性患者的概率。

随机变量

2.1 随机变量及其分布
随机变量
这里描述的是在随机试验 $E$ ，在样本空间中 $\Omega$ ，每 $\omega$ 都在实数域上有对应的值 $X(\omega)$ 与之对应，那么这个 $X(\omega)就是我们需要关注的值$
注意
随机变量的取值并不是固定的，这区别与普通的函数，每个样本点随对应的随机变量的取值也是不确定的。我们关心随机变量，往往关心它的取值的概率，而不是他去那些值
分布函数

分布函数的定义:
分布函数的公式如下所示，设随机变量X，对于任意的x都有
$(-\infty<x<+\infty)$
我们管这样的函数叫做分布函数，也叫做概率累加函数

2.2 离散型随机变量

如果随机变量 $X$ 的全部x的取值为可列无穷多个。X称为离散型随机变量，,那么其对应的概率为
$P(X=x_k)=p_k k=1 ,2, 3, 4........$
其对应的分布函数为
$F(X)=\displaystyle\sum_{k=1}^{X=x_k}p_k$
这样部门管这个叫做离散函数的分布律

2.3 常见的离散分布
2.3.1 伯努利实验和二项式分布
定义
如果一个实验只有两种结果，我们则管这样的分布叫做伯努利分布，其公式如下所示
$\ \ \ \ \ \ \ P(\bar X)=1-p$
$\ \ \ \ \ \ \ \ 0<p<1$
如果像这样的实验可重复n次进行，则叫做n重伯努利分布

伯努利分布中有一个重要的分布叫做二项式分布，
其中二项式分布，表示在n此实验中正事件所发生的概率
其公式为
$P(x=k)=C_n^kp^k(1-p)^{n-k} k= 0 1 2 3 4$
*记作B（n, k）表示的是n次实验中k次发生的概率为k的概率是多少。

其分布函数为
$F(x)=\displaystyle\sum_k^{|x|}C_n^kp^k(1-p)^{n-k}$
$这里需要注意的是意思就是如果想知道有三次成功的概率则需要将 0 次 1 次 2 次 3 次的概率加在一起就是这个概率分布的意思$

随机变量的数字特征
2.4.1 数学期望
离散型
$E(x)=\displaystyle\sum_{k=1}^{x_k}x_kp_k)$ $这里\displaystyle\sum_{k=1}^{x_k}x_kp_k是收敛的$
对于连续性
$E(x)=\int_{-\infty}^{+\infty}xf(x)$ $其中 f (x) 被称为概率密度函数$
这个数学期望也被称为均值

性质
1 若c为一个常数，则 $E (c) = c$
2 $E (a X + b Y) = a E (X) + b B (Y)$
3 X Y独立则有 $E (X Y) = E (X) E (Y)$

2.4.2 方差
$var(x)=E((X-E(x)^2))$
$\sqrt{var(x)}叫做均方差$

性质
1 若C为常数，则 $v a r (c) = 0$
2 $var(cX+b)=c^2E(X)$
3 若X Y独立
$v a r (X = Y) = v a r (X) + v a r (y)$

协方差和相关系数
协方
$c o v (X, Y) = E ((X - E (x) ∣ Y - E (Y))$

性质
$1 c o v (X, Y) = c o v (Y, X)$
$)\ \ \ a \ b\ c\ d为任意常数$
$3 cov(X_1+X_2,Y)=cov(X_1,Y)+cov(X_2,Y)$
$cov(X,Y)=E(XY)-E(X)E(Y\ \ \ \ X\ \ \ Y相互独立$
$|cov(X,Y)|<=\sqrt{var(X)}\sqrt{var(Y)}$
$6 c o v (X, X = v a r (X))$

相关系数

基本上我们会用相关系数来衡量两个变量之间额关系，相关系数的取值从-1到1，当小于0是则代表负相关，大于零时则代表正相关，当其绝对值越接近1是则代表相关性程度越好

公式
$\rho(x,y)=\frac {cov(x,y)} {\sqrt{var(x)}\sqrt{var(y)}}$

laozhujie

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
概率统计第一章打卡学习

随机事件1.1 基本概念随机现象对事件得结果不能完全预测得现象，称之为随机现象随机试验观察随机现象实现得过程，称为随机试验。记为E条件：1 可以在相同条件下重复进行2 结果有多种可能性，并且所有可能的结果事先已知3 作一次试验究竟哪个结果出现，事先不能确定**样本空间**包含随机实验中所有可能的集合为样本空间，记为 Ω\OmegaΩ样本点实验的每一可能结果称为样本点，记为 ω\omegaω随机事件在样本空间中满足一定条件的子集为随机事件，用大写字母 A,B，Bnote:
复制链接

扫一扫