【机器学习数学基础】——3、概率论与数理统计

最新推荐文章于 2022-08-21 14:50:40 发布

Onedean

最新推荐文章于 2022-08-21 14:50:40 发布

阅读量1.1k

点赞数

分类专栏：数学文章标签：概率论数理统计

本文链接：https://blog.csdn.net/edc3001/article/details/116955192

版权

数学专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、概率论基础

1.1 概率论基础

1.1.1、概率论与数理统计定义

我们知道，自然界中的现象可化为为如下两类：

确定性现象：条件完全决定结果，比如太阳东升西落
随机性现象：条件不完全决定结果（可能出现这样的结果，也可能出现那样的结果，预先无法断言），比如明天是否下雨

进一步，什么是概率论与数理统计呢？简而言之，二者都是对随机性现象进行研究的数学工具，具体来说如下：

随机性现象：具有不确定性与统计规律性
概率论：从数量上研究随机现象的统计规律性的科学
数理统计：从应用角度研究处理随机性数据，建立有效的统计方法，进行统计推理

1.1.2、随机试验定义

定义：在概率论中，将具有下述三个特点的试验称为随机试验，简称试验。随机试验常用E表示。

试验的可重复性——在相同条件下可重复进行
一次试验结果的随机性——一次试验的可能结果不止一个，且试验之前无法确定具体是哪种结果出现
全部试验结果的可知性——所有可能的结果是预先可知的，且每次试验有且仅有一个结果出现

例如：
$E_1$ 抛一枚硬币，观察正面 $H$ 、反面 $T$ 出现的情况
$E_2$ 掷一颗骰子，观察出现的点数

1.1.3 样本空间与样本点的定义

样本空间：试验的所有可能结果所组成的集合称为试验 $E$ 的样本空间,记为 $\Omega$
样本点：试验的每一个可能出现的结果（样本空间中的元素）称为试验 $E$ 的一个样本点,记为 $\omega$ 。

例如：
$E_1$ ：抛一枚硬币，观察正面 $H$ 、反面 $T$ 出现的情况； $\Omega_1=\{H,T\}$
$E_2$ ：掷一颗骰子，观察出现的点数情况； $\Omega_2=\{1,2,3,4,5,6\}$

1.2 事件与概率

1.2.1 随机事件/基本事件/复合事件定义

随机事件：样本空间的任意一个子集称为随机事件，简称为事件，记作 $A, B, C$ 等

例如，在试验 $E_2$ 中，令 $A$ 表示为"出现奇数点"， $A$ 就是一个随机事件。

基本事件：仅包含一个样本点 $\omega$ 的随机事件，即单点子集 $\{\omega\}$
复合事件：包含两个或两个以上样本的事件

1.2.2 事件的性质和运算

事件的本质是集合，而集合的一切性质和运算都适用于事件。

1.2.3 频率与概率定义

频率：在相同的条件下，进行了 $n$ 次试验，在这 $n$ 次试验中，事件 $A$ 发生的次数 $n_A$ ，称为事件 $A$ 发生的频数。比值 $\frac{n_A}{n}$ 称为事件A发生的频率，并记成 $f_n(A)$
概率：在相同的条件下进行 $n$ 次重复试验，当 $n$ 趋于无穷大时，事件 $A$ 发生的频率 $f_n(A)$ 稳定于某个确定的常数 $p$ ，称此常数 $p$ 为事件 $A$ 发生的概率，记作 $P (A) = p$

注：上述概率定义属于频率学派定义，实际上学术界有两种观点，一种是频率学派，一种是贝叶斯学派。

1.2.4 概率的性质

性质1、 $\le P(A) \le 1, P(\phi)=0$ （任何一个事件概率介于0到1之间，空事件概率为0）
性质2、 $P(\bar{A})=1-P(A)$ （互补性，任何事件的补事件概率= $1 -$ 这个事件的概率）
性质3、 $P (A - B) = P (A) - P (A B)$
性质4、对于任意事件 $A, B$ ，有 $P (A + B) = P (A) + P (B) - P (A B)$ （加法公式）

例题

例1、设 $A, B$ 为两个随机事件， $P (A) = 0.5$ ， $P (A B) = 0.8$ ， $\cup B)=0.3$ ，求 $P (B)$

答：
$\because P(A+B)=P(A)+P(B)-P(AB)$
$\therefore P(B)=P(A+B)-P(A)+P(AB)=0.8-0.5+0.3=0.6$

1.3 古典概型与几何概型（最简单的概率分布）

1.3.1 古典概型和几何概型的定义

古典概型：理论上，具有下面两个特点的随机试验的概率模型，称为古典概型（或等可能概型):
- 有限性：基本事件的总数是有限的，换句话说样本空间仅含有有限个样本点
- 等可能性：每个基本事件发生的可能性相同

把有限个样本点推广到无限个样本点的场合，人们引入了几何概型，由此形成了确定概率的另一方法——几何方法

几何概型：若对于一随机试验，具有下面三个特点的概率模型，称为几何概型：
- 每个样本点出现是等可能的
- 样本空间 $\Omega$ 所含的样本点个数为无穷多个
- 具有非零的，有限的几何度量，即 $0<m(\Omega)<\infty$

1.3.2 古典概型和几何概型的计算公式

古典概型的概率计算公式如下：
- 设事件 $A$ 中所含样本点个数为 $r$ ，样本空间 $\Omega$ 中样本点总数为 $n$ ，则有： $\frac {r} {n} = \frac {A中样本点数} {\Omega中样本点总数} = \frac {A所包含的基本事件数} {基本事件总数}$
几何概型的概率计算公式如下：
- 当随机试验的样本空间是某个区域,并且任意一点落在度量(长度,面积,体积)相同的子区域是等可能的,则事件A的概率可定义为： $\frac{m(A)}{m(\Omega)}$ 其中， $m(\Omega)$ 是样本空间的度量， $m (A)$ 是构成事件 $A$ 的子区域的度量

例题

例1：从1,2,….9这9个数字中任意取一个数，取后放回，而后再取一数，试求取出的两个数字不同的概率。

答：基本事件总数 $n=9^2$ ，因为第一次取数有 $9$ 种可能取法，这是可重复排列问题。设 $A$ 表示“取出的两个数字不同”。 $A$ 包含的基本事件数 $9 * 8$ :因为第一次取数有 $9$ 中可能取法，为保证两个数不同，第二次取数应从另外的 $8$ 个数中选取，有 $8$ 中可能取法， $r = 9 * 8$ ，故 $\frac{r}{n} = \frac{9*8}{9^2} = \frac{8}{9}$

二、条件概率

2.1 条件概率

2.1.1 前置定义

在学习条件概率定义之前，我们先介绍以下几个定义：

相互独立：事件 $A$ 发生对事件 $B$ 发生的概率没有影响，则称两事件是相互独立。
和事件：事件 $A$ 与 $B$ 至少有一个发生的事件叫做 $A$ 与 $B$ 的和事件，记为 $\cup B$ 或 $A + B$
积事件：事件 $A$ 与 $B$ 都发生的事件叫做 $A$ 与 $B$ 的积事件，记为 $\cap B$ 或 $A B$
互斥：若 $A B$ 为不可能事件，则说事件 $A$ 与 $B$ 互斥

2.1.2 条件概率定义

一般地，设 $A$ 、 $B$ 为两个事件，且 $P (A) > 0$ ，称： $\frac{P(AB)}{P(A)}$ 为在事件 $A$ 发生的条件下，事件 $B$ 发生的条件概率 $P (B ∣ A)$ ，读作： $A$ 发生的条件下， $B$ 的概率

2.1.3 条件概率的几何意义

$P (B ∣ A)$ 相当于把 $A$ 看作新的基本事件，求 $\cap B$ 发生的概率，如下图：
条件概率几何意义

$0 \leq P (B ∣ A) \leq 1$
可加性：如果 $B$ 和 $C$ 互斥，那么 $P [(B U C) ∣ A] = P (B ∣ A) + P (C ∣ A)$

2.1.4 乘法公式

乘法公式：
- 若 $P (B) > 0$ ，由条件概率定义，可得： $P (A B) = P (B ∣ A) P (A) = P (A ∣ B) P (B)$ 上式成为条件事件的乘法公式。此外，若 $A$ 、 $B$ 事件相互独立，那么 $P (A B) = P (A) P (B)$
条件概率下的链式法则：
- 前一个公式可以推广到设 $A_1,A_2,A_3,...,A_n$ 为任意 $n$ 个独立事件，且 $P(A_1 A_2…A_n)>0$ ，则 $P(A_1 A_2…A_n)=P(A_1)P(A_2|A_1)P(A_3 | A_1 A_2)...P(A_n | A_1 A_2..A_{n-1})$ 那么我们称这个公式是条件概率下的链式法则

2.2 全概率公式

2.2.1 排列与组合

三、概率分布与统计量

3.1 概率分布类型

3.2 期望与方差

3.3 高斯分布

四、概率分布进阶

4.1 分布函数

4.2 均匀分布

4.3 指数分布

五、联合分布

5.1 二维随机变量及联合概率分布

5.2 边缘概率

六、主成分分析法

6.1 多维分布与协方差

6.2 主成分分析法

Onedean

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
【机器学习数学基础】——3、概率论与数理统计

概率论与数理统计一、概率论基础1.1 概率论基础1.2 事件与概率1.3 古典概率与集合概型二、条件概率2.1 条件概率2.2 全概率公式三、概率分布与统计量3.1 概率分布类型3.2 期望与方差3.3 高斯分布四、概率分布进阶4.1 分布函数4.2 均匀分布4.3 指数分布五、联合分布5.1 二维随机变量及联合概率分布5.2 边缘概率六、主成分分析法6.1 多维分布与协方差6.2 主成分分析法一、概率论基础1.1 概率论基础1.1.1、概率论与数理统计定义我们知道，自然界中的现象可化为为如下两
复制链接

扫一扫