一.随机变量
随机变量是指随机事件的数量表现,按照随机变量可能取得的值,可以把它们分为两种基本类型:随机变量包括离散型随机变量和连续型随机变量。
离散型随机变量:在一定区间内变量取值为有限个或可数个。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。离散型随机变量的概率分布包括伯努利分布、二项分布、几何分布、泊松分布。
连续型随机变量:在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值,一批传染性肝炎患者的血清转氨酶测定值等。连续型随机变量的概率分布包括正态分布、幂律分布
二.准备工作
在python中实现计算常见概率分布的概率值,需要安装python的科学计算包scipy,并用matplotlib 包进行绘图。打开终端Anaconda Prompt,在conda中运行以下命令:
conda install scipy
三.概率分布
概率分布,是概率论的基础概念之一,是指用于表述随机变量取值的概率规律。事件的概率表示了一次试验中某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即随机试验的概率分布。以下介绍几种概率分布:
1.伯努利分布
伯努利分布亦称“零一分布”、“两点分布”,一个非常简单的试验是只有两个可能结果的试验,比如正面或反面,成功或失败,有缺陷或没有缺陷,病人康复或未康复。伯努利分布是一个离散型机率分布,是N=1时二项分布的特殊情况。
案例:玩抛硬币的游戏,只抛1次硬币,成功抛出正面朝上记录为1,反面