数据科学-概率与概率分布
1. 随机事件及其概率
1.1 随机事件的几个基本概念
试验和事件
在同一组条件下,对某事物或现象所进行的观察或实验叫做试验,把观察或试验的结果叫做事件
**随机事件:**在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件
**必然事件:**在同一组条件下,每次试验一定出现的事件
**不可能事件:**在同一组条件下,每次试验一定不会出现的事件
如果一个时间不能分解为两个或更多个事件,则这个事件成为基本事件或简单事件。
基本事件特征:在一次试验中,只能观察到一个且仅有一个简单事件。
如果试验中所有的简单事件的全体称为样本空间或基本空间。
1.2 事件的概率
事件 A A A的概率是对事件 A A A在试验中出现的可能性大小的一种度量,记事件 A A A出现的可能性大小的数字为 P ( A ) P(A) P(A), P ( A ) P(A) P(A),称为事件 A A A的概率。
概率的古典定义
古典概率的特点
- 结果有限。即样本空间中只含有限个元素。如,掷硬币试验中,只能出现 正面朝上和反面朝上两种结果。
- 各个结果出现的可能性被认为是相同的。如掷硬币,出现正面或反面的机会是相等的。
定义:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件 A A A发生的概率为该事件所包含的基本事件格式m与样本空间所包含的基本事件格式n的比值,记为
古典概率的局限在随机试验只有有限个可能结果的范围内,这使其应用受到很大的限制。
概率的统计定义
在相同条件下随机试验 n n n次,某事件 A A A出现 m m m次 ( m ⩽ n ) (m \leqslant n) (m⩽n),则比值 m / n m / n m/n 称为事件 A A A发生的概率。随着 n n n的增大,该频率围绕某一常数 p p p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为
P ( A ) = m n = p P(A)=\frac{m}{n}=p P(A)=nm=p
主观概率定义
指一些无法重复试验,只能根据以往经验,人为确定这个事件的概率。
2. 离散型随机变量及其分布
2.1 随机变量的概念
随机事件的数量化
为了把随机事件数量化,以便作数学上的处理,有必要把不采用数量标识表示化采用数量标识表示。
随机变量的定义
在同一组条件下,如果每次试验可能出现这样或那样的结果,并且所有的结果都能列举出来,即 X X X的所有结果, x 1 x_{1} x1, x 2 x_{2} x2,… x n x_{n} xn 都能列举出来,而且 X X X的可能值 x 1 x_{1} x1, x 2 x_{2} x2,… x n x_{n} xn具有确定的概率 P ( x 1 ) P\left(x_{1}\right)