首先,讲什么是概率,它并不是是某个事件发生的频率,否则的话如何解释“我认为有90%的可能性是他干的”这种说法。其实概率的公理化定义非常抽象,就是(样本,事件,概率测度)组成的集合。
在古典概率模型下(等可能事件),概率的计算问题基本可以归结的排列组合之类的计数问题,而这又是技巧性非常强的问题,基本场景可以分为4类:乘积、排列、组合以及分割。然后一般会介绍条件概率和贝叶斯公式。
接下来的主线就是离散与连续的并行。但是这中间需要有一个称为随机变量的东西过度。随机变量的定义也很有意思,就是把样本空间中事件通过函数映射成的一个函数值。刻画离散随机变量使用的是pmf,连续随机变量使用的是pdf,二者都可以通过cdf来描述。常见的离散随机变量包括均匀、泊松分布、伯努利、二项分布、几何分布。常见的连续随机变量包括均匀、指数分布和正态分布。除了使用pmf或者pdf刻画随机变量以外,可以通过一些简单的特征衡量随机变量,比如均值和方差。均值衡量了随机变量的平均结果,而方差则则反映了他们发生值的分散程度。
相比于一个随机变量,多个随机变量的联合分布也是经常要考虑的。他们的相关概念与单个随机变量是平行的。例如,联合PDF(PMF)。对联合分布的1维求和或者积分,就可以得到边沿PDF或者PMF。联合相关的概念还包括条件pdf或则pmf,它代表了具有联合概率密度函数的两个随机变量中的一个发生后,另一个随机变量的可能取值情况。利用条件pdf或者pmf,我们还可以计算条件期望,它代表两个有关系的随机变量中的一个发生了以后,另一个随机变量可能取值的加权平均。它是第一个随机变量的函数,对这个函数再取期望,就能得到第一个随机变量的期望了。与之相关的概念就是独立,它代表了其中1个随机变量的取值&#x