概率基础补习

光明中黑暗

已于 2024-10-10 19:34:44 修改

阅读量902

点赞数 14

文章标签：概率论学习笔记

于 2024-10-10 19:31:42 首次发布

本文链接：https://blog.csdn.net/qq_71751106/article/details/142829996

版权

事件概率

事件

事件是指在某个试验或观察中可能发生的结果或结果的集合。是样本空间的一个子集，可以包含一个或多个样本点，也可以是整个样本空间。事件用大写字母，如 A，B，C 等表示。

1.1 概念

1.1 基本事件

基本事件是指试验中不可再分的最简单的事件。每个基本事件代表一个单一的可能结果。

1.2 复合事件

复合事件是由多个基本事件组合而成的事件。复合事件代表多个可能结果的集合。

1.3 必然事件

必然事件是指在试验中一定会发生的事件。必然事件的概率为1。在样本空间中，必然事件包括了样本空间中的所有样本点。

1.4 不可能事件

不可能事件是指在试验中绝对不会发生的事件。不可能事件的概率为0。通常用∅表示。

1.5 样本空间

样本空间是指试验中所有可能结果的集合。样本空间通常用大写字母 Ω 表示。

1.6 样本点

样本点是指样本空间中的每一个元素，即每一个可能的结果。样本点通常用小写字母ω表示。

注：必然事件和样本空间可以被视为等价的，但理论上它们是不同的概念。必然事件是事件的一个实

例，而样本空间是定义这些事件的基础集合。

事件间的关系

1.2.1 包含关系

包含关系是指一个事件是另一个事件的子集。如果事件 A 包含在事件 B 中，那么 A 发生时，B 必然发生，即：A⊆B

1.2.2 并集

并事件是指两个或多个事件中至少有一个事件发生的情况。事件 A 和事件 B 的并事件记作 A∪B或A+B，表示 A 或 B 发生

1.2.3 交集

交事件是指两个或多个事件同时发生的情况。事件A 和事件 B 的交事件记作 A∩B或AB，表示 A 和 B 同时发生。

1.2.4 差集

如果事件 A 发生而事件 B 不发生，则表示这些事件的差集发生了。即将事件A中的A和B的公共部分去掉。事件 A 和 B 的差集表示为 A−B

1.2.5 互斥事件

互斥事件是指两个事件不能同时发生。如果事件A 和事件 B 是互斥事件，那么 A 和 B 的交集为空集，即：AB=∅

1.2.6 对立事件

对立事件是指两个事件互为对立，即一个事件发生时，另一个事件必然不发生。如果事件 A 和事件 B

是对立事件，那么 A 和 B 的并集是样本空间，且 A 和 B 的交集为空集，即：

A+B=Ω且AB=∅

通常，事件 A 的对立事件记作

互斥和对立事件的区别：

1.两个事件对立，则一定是互斥事件

2.互斥事件适用于多个事件，对立适用于两个事件

3.互斥事件，A和B不能同时发生，也可以都不发生；对立事件有且只有一个发生。

1.2.7 完备事件组

是一组事件，它们满足以下两个条件：

1. 互斥性：完备事件组中的任意两个事件不能同时发生。也就是说，这些事件两两互斥。

2. 完备性：完备事件组中的事件涵盖了样本空间中所有可能的结果，并且至少有一个事件必然发生。

换句话说，这些事件的并集是整个样本空间，且它们的并集是必然事件。

用数学术语来说，如果有一个样本空间 Ω 和一个事件集合 {A1,A2,...,An}，那么这个事件集合是完备的，如果：

对于所有的 i≠j，有

（互斥性）。

（完备性）。

1.3 运算律

1.3.1 交换律

交换律是指事件的并集和交集运算满足交换性，即运算的顺序不影响结果。

并集的交换律：

A∪B=B∪A

交集的交换律：

A∩B=B∩A

1.3.2 结合律结合律是指事件的并集和交集运算满足结合性，即多个事件的运算顺序不影响结果。

并集的结合律：

(A∪B)∪C=A∪(B∪C)

交集的结合律：

(A∩B)∩C=A∩(B∩C)

1.3.3 分配律

分配律是指事件的并集和交集运算满足分配性，即一个运算对另一个运算的分配关系。

并集对交集的分配律：

A∪(B∩C)=(A∪B)∩(A∪C)

交集对并集的分配律：

A∩(B∪C)=(A∩B)∪(A∩C)

1.4.4 对偶律

对偶律是指事件的补集运算的对偶关系，即并集的补集和交集的补集之间的关系。

第一对偶律：

第二对偶律：

概率

定义

对于一个事件 A，其概率 P(A) 定义为：

古典模型

古典概率模型，也称为古典模型或等可能模型，是一种概率论中用于计算随机事件发生概率的方法。它基于以下假设：

1. 有限性：样本空间是有限的，即所有可能的结果可以被列举出来。

2. 等可能性：样本空间中的每个基本事件（样本点）出现的可能性是相等的。

在古典模型中，一个事件的概率可以通过以下公式计算：

古典模型的步骤：

1. 确定样本空间：列出随机试验所有可能的结果。

2. 计数：计算样本空间中基本事件的总数。

3. 识别事件：确定事件 A 包含的基本事件数。

4. 计算概率：使用上述公式计算事件 A 的概率。

排列(不重复排列)

排列的定义

给定一个包含 n 个元素的集合，从中选择 r 个不同元素（r≤n）进行排列，意味着这 r 个元素的顺序是重要的。

排列的符号

排列通常用 P(n,r)表示，读作“n 个中取 r个的排列数”。

排列的公式

排列数的计算公式是：

其中 n!（n的阶乘）表示从 n 到 1 的所有正整数的乘积，即

排列的计算

如果 r=n，即从 n 个元素中选择 n 个元素进行全排列，排列数为 n!。

如果 r=0，即从 n 个元素中选择 0 个元素进行排列，排列数为 1，因为空集的排列只有一种。

如果 r>n，排列数为 0，因为不可能从 n 个元素中选择超过 n 个元素。

组合

组合的定义

给定一个包含 n 个元素的集合，从中选择 r 个不同元素（r≤n）进行组合，意味着这 r 个元素的顺序并不重要。

组合的符号

组合通常用

表示，读作“n 选 r”或“二项式系数”。

组合的公式

组合数的计算公式是：

组合的性质

对称性：C(n,r)=C(n,n−r)

边界条件：C(n,0)=C(n,n)=1

当 r>n 时，C(n,r)=0

几何概型

几何概型是概率论中的一个基本概念，它用于处理那些结果可以被表示为几何区域（如线段、平面区域、立体区域等）的随机试验的概率问题。几何概型的基本思想是将概率问题转化为几何区域上的面积、体积或长度等几何量的比值。

几何概型的计算：

几何概型的概率可以通过以下步骤计算：

1. 确定样本空间：首先确定样本空间的几何区域，比如长度、面积或体积。

2. 度量样本空间：计算样本空间的度量，比如长度、面积或体积。

3. 确定事件区域：确定事件对应的几何区域，并计算其度量。

4. 计算概率：事件的概率等于事件区域的度量除以样本空间的度量。

几何概型的公式：

如果事件 A 对应的几何区域的度量为 m(A)，样本空间 Ω 的度量为 m(Ω)，则 A 的概率 P(A)为：

假设甲和乙约定在6-7点时间段内到达某个地点会面，先到者等待15分钟，两人到达的时间是随机的。我们需要确定他们能够相遇的概率。

解：

将1小时换算为60分钟，时间段表示为数轴上的0到60之间的区间。

甲到达的时间用 x 表示，乙到达的时间用 y 表示，其中 0≤x,y≤60。

样本空间 Ω 可以表示为一个边长为60的正方形，其中 (x,y)表示甲和乙到达的时间。

可能甲先到，也可能乙先到，甲和乙相遇，这意味着甲和乙到达的时间差不超过15分钟，即

∣x−y∣≤15。

根据几何概型，实际上是求图形中阴影部分的面积与整个正方形面积的比值。

频率

1. 定义：频率是一个经验概念，它通过实际观察或实验来确定。频率是某个事件在一系列重复实验中发生的次数与总实验次数之比。

2. 性质：频率的值可以是任何非负实数，包括0（事件一次也没发生）和任意正数（事件多次发生）。

3. 计算：频率是通过实际计数得到的，例如，如果一个事件发生了 m 次，在 n次独立的重复实验中，其频率为 mn。

4. 不确定性：频率是随机的，它随着实验次数的增加而波动，但根据大数定律，当实验次数足够多时，频率会趋近于概率。

概率与频率的关系

大数定律：随着实验次数的增加，事件发生的频率趋近于其概率。

长期稳定性：在大量重复实验中，频率的稳定性可以作为概率的一个估计。

经验估计：在没有理论模型的情况下，可以通过频率来估计概率。

2.7 基本性质（公理化）

非负性：对于任意事件 A，有 P(A)≥0。

规范性：必然事件的概率为1，即 P(Ω)=1。

可加性：对于互斥事件 A 和 B，有 P(A+B)=P(A)+P(B)。

性质1：P(∅)=0

性质2：

性质3：

性质4：P(A+B)=P(A)+P(B)-P(AB)

证明：

A+B=A+(B-AB)，可根据图形理解。

P(A+B)=P(A+(B-AB))=P(A)+P(B)-P(AB)

注意：性质4是可加性的一般性描述，如果A和B互斥那么AB为空集，则P(AB)=0

另外性质4还适用于多个事件相加：

如果A、B、C是互斥事件：则P(AB)=P(AC)=P(BC)=P(ABC)=0

所以：

P(A+B+C)=P((A+B)+C)=P(A)+P(B)-P(AB)+[P(C)-P(AC)] - [P(BC)-P(ABC)](这一段为加上C的部分）

P(A+B+C)相当于三个圆的公共部分，即图中蓝色部分，P(A)+P(B)+P(C)相当于三个圆相加，但是中间重叠部分（AC、AB、BC）被加了两次，所以需要减掉一次P(AC)、P(AB)、P(BC)，在减掉P(AC)、P(AB)、P(BC)时最中间（三色重叠）的部分被减掉了，所以还要再加上P(ABC)

条件概率

条件概率用于描述在已知某一事件发生的情况下，另一事件发生的概率。条件概率通常表示为 P(A∣B)，读作“在事件 B 发生的条件下，事件 A 发生的概率”。

定义

设Ω为样本空间， A和 B 是两个事件，且 P(B)>0。事件 A 在事件 B 发生的条件下的条件概率 P(A∣B) 定

义为：

说明：

P(A)：无条件概率，样本空间为Ω

P(A|B)：条件概率，样本空间不再是Ω，而是B

或者

所以条件概率定义公式中P(B)为B事件发生的总事件数概率，P(A∩B)是在B发生的条件下A发生的事件概率，即A和B共同发生的事件概率

基本性质

非负性：对于任意事件 A和B，有 P(A|B)≥0。

规范性： P(Ω|B)=1。

可加性：对于互斥事件

乘法公式

条件概率的乘法公式是：

这个公式说明了事件 A 和事件 B 同时发生的概率等于事件 B 发生的概率乘以在 B 发生的条件下 A 发生的概率。

说明：以上公式可以理解为分几步走，第一步B发生的概率，第二步在B发生的前提下A发生的概率。

补充：如果有A、B、C事件

按照分几步走的逻辑：

第一步A发生的概率，第二步在A发生的前提下B的概率，第三步在AB发生的前提下C的概率，相当于每一步都要以前一步作为发生条件。

全概率公式

假设事件 A1,A2,...,An 是样本空间 Ω 的一个完备事件组，即这些事件两两互斥，并且它们的并集是整个样本空间。如果我们想计算事件 B 的概率，可以使用全概率公式：

计算某一事件的总概率，通过将其分解为多个互斥事件的条件概率之和。

贝叶斯公式

贝叶斯公式描述了在已知其他条件概率的情况下，一个条件概率的计算方法。贝叶斯公式是逆概率理论的核心，它允许我们根据已知的某些概率来更新我们对另一个概率的信念。

例如：感冒、肺炎、白血病的症状都是发烧，在已知病人发烧的情况下，来推理病人发病的原因。可以把感冒、肺炎、白血病理解为原因，发烧是导致的结果，由已知结果推理原因的方法就是贝叶斯公式的核心理论。

定义

如果事件 B1,B2,...,Bn是样本空间 Ω 的一个完备事件组，即这些事件两两互斥且它们的并集是整个样本空间，那么对于任意事件 A，贝叶斯公式可以表示为：

其中：

P(Bi∣A) 是在事件 A 发生的条件下事件 Bi发生的条件概率(后验概率)。

P(A∣Bi)是在事件 Bi发生的条件下事件 A 发生的条件概率(似然度)。

P(Bi)是事件 Bi发生的边缘概率(先验概率)。

P(A)是事件 A 发生的边缘概率(先验概率)，可以通过全概率公式计算得出：

说明：事件A理解为结果，在已知事件A的条件下，事件Bi发生的概率即为贝叶斯公式。

事件独立性

如果两个事件是独立的，那么一个事件的发生不会影响另一个事件发生的概率。

条件概率与独立性如果事件 A 和事件 B 是独立的，那么事件 A 在事件 B 发生的条件下的条件概率 P(A∣B)等于事件 A 的先验概率 P(A)：

同样地，事件 B 在事件 A 发生的条件下的条件概率 P(B∣A)等于事件 B 的先验概率 P(B)：

由条件概率公式可知：

定义

设 A和 B 是两个事件。如果满足以下条件，则称事件 A 和事件 B 是独立的：

其中：

P(AB)是事件 A 和事件 B 同时发生的概率（联合概率）。

P(A)是事件 A 发生的概率。

P(B) 是事件 B 发生的概率。

独立性的性质

1. 对称性：如果 A 和 B 独立，那么 B 和 A 也独立。

2. 传递性：如果 A 与 B 独立，且 B 与 C 独立，那么 A 与 C 独立（仅当这些事件的联合概率分布是乘性的）。

3. 零概率事件：任何事件与零概率事件(P(A)=0)总是独立的。

4. 对立事件：如果 A 与 B 独立，那么 A 与其对立事件也独立。

定理

1.P(A)>0，P(B)>0，A、B独立的充分必要条件是P(AB)=P(A)⋅P(B)

2.P(A)>0，P(B)>0，互不相容和独立不会同时出现。

证明：

如果A、B互不相容则P(AB)=0,P(AB)=P(A)⋅P(B) ,而P(A)P(B)>0，所以A、B不独立

如果A、B独立则P(AB)=P(A)P(B)>0,所以P(AB)>0，从而A、B步互不相容。

伯努利模型

伯努利模型是一种基础的概率模型，它描述了一个随机试验只有两种可能结果的情况：成功或失败。在伯努利模型中，每次试验只有两个可能的结果，通常称为成功和失败。这些结果用事件S和事件F来表示，其中S表示成功，F表示失败。

伯努利模型的关键特点是每次试验的结果是相互独立的，即前一次试验的结果不会影响后一次试验的结果，每次试验中成功的概率为p，失败的概率为1-p，并且这些概率对于每次试验都保持不变。

伯努利模型在概率论、统计学和随机过程等领域中都有重要的应用。例如，在统计学中，可以使用伯努

利模型来建立二元数据的模型，比如用户是否购买产品、是否点击广告等。在风险分析中，伯努利模型可以用来描述某种事件的发生与否，比如是否发生事故、是否发生自然灾害等。在金融数学中，伯努利模型可以用来模拟股票价格的上涨和下跌情况。

前置概念

1. 伯努利试验：

伯努利试验是一种特殊类型的随机试验，其结果只有两种可能：成功或失败。

伯努利试验的结果是二元的，通常用1表示成功，用0表示失败。

2. n重伯努利试验：

n重伯努利试验是指伯努利试验重复进行n次，每次试验都是独立的。

在n重伯努利试验中，每次试验的成功概率相同，通常用p表示，失败概率为1-p。

定义

设试验成功的概率为 p(0<p<1)，失败的概率为 1−p，如果在n重伯努利实验中，成功k次的概率参数为

p 的伯努利分布。

伯努利分布的概率质量函数（PMF）为：

其中，k 是成功的次数，

是组合数，表示从n次试验中选择k次成功的不同方式。

上述公式也叫做二项概率公式。

该公式可以用于二项式的展开公式，如：

如果用二项概率公式展开：

随机变量及其分布

1.定义

随机变量是一个从样本空间（所有可能结果的集合）到实数集的函数。样本空间中的每个结果都对应于随机变量的一个值。随机变量的值可以是离散的，也可以是连续的。随机变量通常用大写字母表示，如X、Y 或 Z。

随机变量和事件的联系

定义事件：

事件可以定义为随机变量取特定值的集合。一般用{X=?}表示。

例如，如果随机变量 X 表示掷骰子的结果，那么事件 "掷得奇数" 可以表示为 {X=1} 或 {X=3}或 {X=5}。

使用随机变量描述事件：

随机变量的值可以定义复杂的事件。

例如，掷硬币的结果为正面、反面，在数学中不方便描述，可以将正面映射为数字1，反面映射为0，那么事件"掷出正面"可以表示为{X=1}，事件"掷出反面"可以表示为{X=0}。

概率分布：

随机变量的概率分布描述了它取每个可能值的概率。这个分布可以用来计算事件的概率。在随机变量表示的事件前加上P来表示：P{X=?}或者P(X=?)。

例如，随机变量 X 的概率质量函数（PMF）或概率密度函数（PDF）可以用来计算 P(X=k) 或

P(a<X<b)。

2.离散型随机变量及其概率分布

离散型随机变量的特点：

1. 可数性：随机变量的取值是可数的，即有限个或可数无限个。

2. 离散性：取值之间有“间隔”，不是连续变化的。

3. 概率分布：每个取值都有一个特定的概率，且所有取值的概率之和等于1。

离散型随机变量的概率分布：

离散型随机变量的概率分布通常由概率质量函数（Probability Mass Function, PMF）描述。PMF 定义了随机变量每个可能取值的概率。

概率质量函数（PMF）：

对于离散型随机变量 X，其概率质量函数为

，其中x是 X 可能取的值。PMF 满足以下条件：

1. 非负性：对于所有的 x，有 P(X=x)≥0。

2. 归一性：所有可能取值的概率之和等于1，即