一、随机变量
对一次事件结果的数值性描述。
1、离散型随机变量:指有穷个的数值或无穷个有间隔数值系列的随机变量。
2、连续型随机变量:代表某一区间或多个区间中的任意数值的随机变量称为连续型随机变量。建立在时间、温度这样的度量单位上的实验结果用连续型随机变量表示。
举个实例:
1) 明天是否下雨,是离散型随机变量,
2) 明天下雨雨量多少,是连续型随机变量。
二、概率分布
数据在统计图中的形状叫做它的分布。
1、概率质量函数和概率密度函数
概率质量函数(probability mass function,简写为PMF):是离散随机变量在各特定取值上的概率。
概率密度函数:(probability density function,PDF):是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。
不同之处:概率质量函数是对离散随机变量定义的,本身代表该值的概率;概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率。
2、常见概率分布:
python中实现:scipy库中的stats模块。
from scipy import stats
a.均匀分布
对于投骰子来说,结果是1到6。得到任何一个结果的概率是相等的,这就是均匀分布的基础。与伯努利分布不同,均匀分布的所有可能结果的n个数也是相等的。
变量X是均匀分布的,则密度函数可以表示为:
均匀分布的曲线是这样的:
你可以看