数据分析必备的概率论和统计学知识
概率论基础
1. 随机事件与概率
随机事件是在随机试验中,可能出现也可能不出现,而在大量重复试验中具有某种规律性的事件叫做随机事件(简称事件)。随机事件通常用大写英文字母A、B、C等表示。随机试验中的每一个可能出现的试验结果称为这个试验的一个样本点,记作ωi。全体样本点组成的集合称为这个试验的样本空间,记作Ω.即Ω={ω1,ω2,…,ωn,…}。仅含一个样本点的随机事件称为基本事件,含有多个样本点的随机事件称为复合事件。
随机事件的特点
(1)可以在相同的条件下重复进行;
(2)每个试验的可能结果不止一个,并且能事先预测试验的所有可能结果;
(3)进行一次试验之前不能确定哪一个结果会出现。
随机事件的关系
- 事件A是事件B的子事件,事件A发生必然导致事件B发生,事件A的样本点都是事件B的样本点,记作A⊂B。
- 若A⊂B且B⊂A,那么A=B,称A和B为相等事件,事件A与事件B含有相同的样本点。
- 和事件发生,即事件A发生或事件B发生,事件A与事件B至少一个发生,由事件A与事件B所有样本点组成,记作A∪B。
- 积事件发生,即事件A和事件B同时发生,由事件A与事件B的公共样本点组成,记作AB或A∩B。
随机变量及其分布
- 随机变量的概率分布
随机变量的分