概率论得学习和整理6：概率分布

概率分布，是指用于表述随机变量取值的概率规律。
事件的概率表示了一次试验中某一个结果发生的可能性大小。
若要全面了解试验，则必须知道试验的全部可能结果及各种可能结果发生的概率，即随机试验的概率分布。
如果所有试验结果（表示多个事件）用变量X的取值来表示，则随机试验的概率分布就是随机变量的概率分布，即随机变量的可能取值及取得对应值的概率。
根据随机变量所属类型的不同，概率分布取不同的表现形式。

2.4 两种事件，两种概率完全不等价

随机变量和随机事件，完全不是一回事，随机变量是包括各种多种事件，各种可能事件组合等的。
概率分布是Pi 和概率p 完全不是一回事，不能等价。随机事件的概率是一个确定的数=p ，而随机变量的Pi一般都是一个函数，一个关于随便变量的概率函数，pdf
因为随机事件--对应概率，这个概率是个固定的，且 1>= p>=0 是一个确定的小数。
但是随机变量（和编程一样，变量是存储可变化的值的），会因为随机变量取不同的值而对应不同的概率，所以随机变量的概率不是一个确定的数，而是多个概率，所以得用函数形式表示。

3 什么是概率分布

3.1 概率分布的定义

概率分布：
随机变量取值的规律
什么样的规律？因为随机变量的取值是有概率的，所以这个规律就是关于概率的规律，就是随机变量的概率规律

3.2 概率的分布的由来

怎么就跳到概率分布了呢？

step1: 首先有1个实验，实验可以划分为不同的事件
step2: 事件有不同的发生次数，绝对次数并没什么用
step3: 但是把事件的绝对次数处理为占比比例，就是事件发生的概率，但是概率只显示为百分比% 和饼图这种简单的分析显然是不够用，接下来怎么分析呢？
这个概率，就是事件的概率，固定概率。
step4: 从各种可能的事件--推出一个对应的随机变量。这个随机变量包含多个基础事件，是一个定义在概率空间(Ω, F, P)上的F的子集。
step5：用概率分布（图）来分析不同的事件组合的事件--随机变量--概率的关系，并图示化，这就是所谓的概率分布函数，概率分布图等

思维导图：怎么从事件--次数---概率--概率分布的逻辑流程

下面是思维导图(以前画的，感觉内容有点不完整，暂时放这先)

3.3 为什么一定要分析概率的分布（规律）？

因为随机事件--对应概率，这个概率是个固定的，且 1>= p>=0 是一个确定的小数。
但是随机变量（和编程一样，变量是存储可变化的值的），会因为随机变量取不同的值而对应不同的概率，所以随机变量的概率不是一个确定的数，而是多个概率，所以得用函数形式表示。
若要全面了解试验，则必须知道试验的全部可能结果及各种可能结果发生的概率，即随机试验的概率分布
而且首先不同的概率分布，有不同的规律，差异很大
而各种复杂的分布规律，需要借助更高级的数学工具去分析

3.4 概率分布就是概率分布规律

= 概率分布律/ pdf函数 / pdf函数图（概率分布图）

比如，二项分布的概率 p(x=k)=C(n,k) * p^k* (1-p) ^(n-k)
对应的概率分布函数就是如下的图里的函数
但是要明白每种分布的随机变量，比如二项分布中，试验次数n以及确定，需要考察的随机变量是总实验此时内可能成功的次数k（k可能变化）
概率分布就是pdf 函数
横轴是随机变量k, 纵轴肯定是概率P(每个不同的k 对应的Pk)

3.5 这些概念说的是一回事

我觉得，如果有下面的各种说法是一回事

某个（随机变量的）概率模型
某个（随机变量的）概率分布
随机变量所有不同取值对应的概率，这些概率的集合
随机变量的概率集合
随机变量的概率函数
关于随机变量的概率规律
关于随机变量的权重规律（权重=概率）

4 怎么表示概率的分布？

4.1 下面的方法都可以表示概率分布规律

概率分布，是指用于表述随机变量取值的概率规律。
而且一定是表示了，整个样本空间的，全部随机变量的取值和对应的概率
而且无论是概率分布函数，还是分布图，都能显示出，概率的分布规律

概率分布律表格
概率分布函数pdf
概率分布图/pdf函数图

4.2 概率分布律

概率分布律：law of probability distribution
即概率分布的规律，表达式总结

分布律	事件	A	B	C	D
	随机变量	0	1	2	3
	概率	10%	20%	60%	10%
	累计概率	10%	30%	90%	100%

4.3 概率分布函数

4.3.1 PMF （离散的）

PMF : 概率质量函数 / 概率分布函数（probability mass function), 概率质量函数是离散随机变量在各特定取值上的概率。
常见的连续随机变量分布的PDF函数：均匀分布，指数分布，Gamma分布和正态分布等。
简单的说
可以是个if,
也可以说是个分段函数

在这里插入图片描述

4.3.2 PDF （连续的）

PDF：概率密度函数（probability density function）, 连续型随机变量的概率密度函数（在不至于混淆时可以简称为密度函数）是一个描述这个随机变量的输出值，在某个确定的取值点附近的可能性的函数。
常见的离散随机变量分布的PMF函数：伯努利分布，二项分布，泊松分布。
简单的说，就是一个积分

在这里插入图片描述