概率论的研究目的:给定 随机试验的数据生成过程,研究 数据的概率性质,如概率分布、数字特征。
一、随机变量
- 概率分布=样本空间+概率,数字特征:数学期望、方差;
- 随机变量(大写字母),定义太复杂,以我的理解就是利用变量来统称样本空间中的样本点,取值为样本点所对应的实数值
作用:表达简洁、量化样本空间中的元素,即样本点; - 随机变量分类:
离散型随机变量:全部可取值为有限个或者可列无限多个(例如数列)
非离散型随机变量:全部可取值为不可列无限多个。
连续型随机变量属于非离散型随机变量,但非离散型随机变量不等于连续性随机变量
二、分布律及常见离散分布
- 分布律(表格表示):离散型随机变量X的所有可能取值及其概率,
- 常见的分布律:
① 0-1分布:例如一件产品的质量合格与否,1表示不合格,概率为p,则0表示合格,概率为1-p
将分布律为的随机变量X称为服从以p为参数的(0-1)分布
伯努利(Bernoulli)试验:只有两个样本点的随机试验。在机器学习中用于两类分类问题。
② 二项分布:n重伯努利试验:独立 (不受其他影响)重复进行N次 服从相同(0-1)分布 的伯努利试验
伯努利试验的两种结果为和(A的逆事件),。进行n重伯努利试验,随机变量X为事件A发生的次数,那么X的分布律为,称X服从参数为n,p的二项分布,记为
三、分布函数和概率密度函数
- 分布函数(可以描述离散和非离散型):设X为一个随机变量,x为任一实数,则称为X的分布函数。
- 分布函数的性质:
① F(x)是一个不减函数。若
② - 概率密度函数:如果对于随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数x有,则称X为连续型随机变量,其中f(x)称为X的概率密度函数。
- 概率密度函数的性质:
①
②
③
四、常见概率密度分布
- 均匀分布:若连续型随机变量X具有概率密度函数则称X在区间上服从均匀分布,记为。