二维随机变量期望公式_统计概率思维(一):随机变量与概率分布详解

前言

4ab37aaf0661d0ff8e4e9627dd1794ec.png

一、随机变量

(一)概念

在统计概率中,用事件来表示某件事情,在一定条件下,可能发生也可能不发生的事件,我们称为随机事件。随机变量是用来量化随机事件的函数,它将随机事件每一个可能的试验结果赋于一个数值。随机变量通常用X、Y等大写字母表示。

例如:明天是否下雨这个随机事件,则可定义随机变量。下雨就等于1,不下雨就等于0(根据需要定义函数值,不一定是0、1),这样,随机变量即将随机事件的结果映射到定义好的数值。又因为明天是否下雨是随机的,即随机变量可取定义好的一个值。

(二)分类

随机变量可分为:离散随机变量连续随机变量

离散随机变量:即 结果可一一列举出来,也可以说是从一个数字到另一个数字,中间有一定间隔。例:明天是否下雨,结果不是1就是0。

连续随机变量:即 事件有无数个结果,将这些数字可以用一条光滑的曲线连起来。例如:明天下雨毫米数,可能是1.1、1.11、1.111等数字。

可知:离散随机变量与连续随机变量的概率分布是有差别的。

二、概率分布

数据在统计图中的形状叫做它的分布

概率分布,将随机变量、概率、分布这三个东西组合起来的一种表现手段。用统计图来表示随机变量的所有可能结果和对应结果发生的概率。 横轴是随机变量的数字,也就是随机事件的所有可能结果,纵轴是横轴上对应结果发生的概率。

根据随机变量类型的不同,概率分布也分为离散概率分布和连续概率分布。

计算离散随机变量的概率公式:概率质量函数(PMF)。本文讨论 4种 常见的离散概率分布:伯努利分布、二项分布、几何分布、泊松分布

计算连续随机变量的概率公式:概率密度函数(PDF)。本文讨论 2种 常见的连续概率分布:正态分布、幂律分布

(一)离散概率分布

1、离散概率分布:伯努利分布

1.1 概念:在同样的条件下,重复地进行相互独立的随机试验。其特点为这个随机试验只有2个可能结果(例如抛硬币试验,要么正面、要么反面)。

1.2 检验是否符合伯努利分布:若某事件符合伯努利试验,则服从伯努利分布,如抛硬币。

1.3 用Python实现伯努利分布

#统计计算包的统计模块
import scipy.stats as stats
import numpy as np
import matplotlib.pyplot as plt

# 第 1 步:定义随机变量为 1 次,抛硬币。正面朝上即为 1,反面朝上即为 0。
# 用 arange() 方法生成等差数列,表示:0为起点,不超过 2,步长为 1。
X = np.arange(0,2,1)
print(X) # [0 1]

# 第 2 步:计算对应分布的概率:概率质量函数(PMF)
# 它返回一个列表,列表中每个元素表示随机变量中对应值的概率
p = 0.5   #硬币朝上的概率
pList = stats.bernoulli.pmf(X,p)
print(pList) # [0.5 0.5]

# 第 3 步:画图
'''
plot默认绘制折线图,本例中只绘制点(下面输入的参数不画线,只画点),
marker:点的形状,值为“o”,表示点为圆圈标记(circle marker)
linestyle:线条的形状,值None表示不显示连接各个点的折线
'''
# 3.1 设置成微软雅黑,支持中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']

# 3.2 创建画布
plt.figure(figsize=(20,8),dpi=80)

# 3.3 绘制图形
plt.plot(X,pList,marker='o',linestyle='None')

'''
vlines用于绘制竖直线(vertical lines),
参数说明:
vlines(x坐标值,y坐标最小值,y坐标最大值)
传入的 X 是一个数组,是给数组中的每个 X坐标 值绘制竖直线,竖直线 y坐标 最小值是0;
y坐标 值最大值是对应pList中的值;
'''

plt.vlines(X,0,pList)

#x轴文本
plt.xlabel('随机变量:抛硬币1次')

#y轴文本
plt.ylabel('概率')

#标题
plt.title('伯努利分布:p=%.1f'% p)

#显示图形
plt.show()

ec04897123e9b90a7b2dd3f0d3cf000a.png
伯努利分布

2、离散概率分布:二项分布

2.1 概念:二项分布是求做重复n次独立的伯努利试验中成功k次的概率。

若某件事发生次数固定,我们感兴趣的是成功次数的概率,即可用二项分布计算其概率。例如:抛硬币5次,其中3次正面朝上的概率是多少?

2.2 检验是否符合二项分布

  • 做某件事的次数是固定的,次数用 n 表示,n 次某件事是相互独立的;
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值