前言
![4ab37aaf0661d0ff8e4e9627dd1794ec.png](https://i-blog.csdnimg.cn/blog_migrate/39a2e007645af5081f66d5180d601b40.jpeg)
一、随机变量
(一)概念
在统计概率中,用事件来表示某件事情,在一定条件下,可能发生也可能不发生的事件,我们称为随机事件。随机变量是用来量化随机事件的函数,它将随机事件每一个可能的试验结果赋于一个数值。随机变量通常用X、Y等大写字母表示。
例如:明天是否下雨这个随机事件,则可定义随机变量。下雨就等于1,不下雨就等于0(根据需要定义函数值,不一定是0、1),这样,随机变量即将随机事件的结果映射到定义好的数值。又因为明天是否下雨是随机的,即随机变量可取定义好的一个值。
(二)分类
随机变量可分为:离散随机变量 和 连续随机变量。
离散随机变量:即 结果可一一列举出来,也可以说是从一个数字到另一个数字,中间有一定间隔。例:明天是否下雨,结果不是1就是0。
连续随机变量:即 事件有无数个结果,将这些数字可以用一条光滑的曲线连起来。例如:明天下雨毫米数,可能是1.1、1.11、1.111等数字。
可知:离散随机变量与连续随机变量的概率分布是有差别的。
二、概率分布
数据在统计图中的形状叫做它的分布。
概率分布,将随机变量、概率、分布这三个东西组合起来的一种表现手段。用统计图来表示随机变量的所有可能结果和对应结果发生的概率。 横轴是随机变量的数字,也就是随机事件的所有可能结果,纵轴是横轴上对应结果发生的概率。
根据随机变量类型的不同,概率分布也分为离散概率分布和连续概率分布。
计算离散随机变量的概率公式:概率质量函数(PMF)。本文讨论 4种 常见的离散概率分布:伯努利分布、二项分布、几何分布、泊松分布
计算连续随机变量的概率公式:概率密度函数(PDF)。本文讨论 2种 常见的连续概率分布:正态分布、幂律分布
(一)离散概率分布
1、离散概率分布:伯努利分布
1.1 概念:在同样的条件下,重复地进行相互独立的随机试验。其特点为这个随机试验只有2个可能结果(例如抛硬币试验,要么正面、要么反面)。
1.2 检验是否符合伯努利分布:若某事件符合伯努利试验,则服从伯努利分布,如抛硬币。
1.3 用Python实现伯努利分布
#统计计算包的统计模块
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt
# 第 1 步:定义随机变量为 1 次,抛硬币。正面朝上即为 1,反面朝上即为 0。
# 用 arange() 方法生成等差数列,表示:0为起点,不超过 2,步长为 1。
X = np.arange(0,2,1)
print(X) # [0 1]
# 第 2 步:计算对应分布的概率:概率质量函数(PMF)
# 它返回一个列表,列表中每个元素表示随机变量中对应值的概率
p = 0.5 #硬币朝上的概率
pList = stats.bernoulli.pmf(X,p)
print(pList) # [0.5 0.5]
# 第 3 步:画图
'''
plot默认绘制折线图,本例中只绘制点(下面输入的参数不画线,只画点),
marker:点的形状,值为“o”,表示点为圆圈标记(circle marker)
linestyle:线条的形状,值None表示不显示连接各个点的折线
'''
# 3.1 设置成微软雅黑,支持中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']
# 3.2 创建画布
plt.figure(figsize=(20,8),dpi=80)
# 3.3 绘制图形
plt.plot(X,pList,marker='o',linestyle='None')
'''
vlines用于绘制竖直线(vertical lines),
参数说明:
vlines(x坐标值,y坐标最小值,y坐标最大值)
传入的 X 是一个数组,是给数组中的每个 X坐标 值绘制竖直线,竖直线 y坐标 最小值是0;
y坐标 值最大值是对应pList中的值;
'''
plt.vlines(X,0,pList)
#x轴文本
plt.xlabel('随机变量:抛硬币1次')
#y轴文本
plt.ylabel('概率')
#标题
plt.title('伯努利分布:p=%.1f'% p)
#显示图形
plt.show()
![ec04897123e9b90a7b2dd3f0d3cf000a.png](https://i-blog.csdnimg.cn/blog_migrate/8edd2ec957cc66776e1eb129237a2421.png)
2、离散概率分布:二项分布
2.1 概念:二项分布是求做重复n次独立的伯努利试验中成功k次的概率。
若某件事发生次数固定,我们感兴趣的是成功次数的概率,即可用二项分布计算其概率。例如:抛硬币5次,其中3次正面朝上的概率是多少?
2.2 检验是否符合二项分布
- 做某件事的次数是固定的,次数用 n 表示,n 次某件事是相互独立的;