统计学——概率分布、期望、方差

文章介绍了概率分布的概念,包括离散随机变量和连续随机变量,以及各自常见的分布类型如伯努利分布和正态分布。概率分布通过统计图表示随机变量所有可能结果的概率。接着,文章讨论了数学期望(期望)作为随机变量预期取值的度量,以及与均值的区别。最后,方差被定义为衡量随机变量变异性的一个量,用于描述数据的风险。
摘要由CSDN通过智能技术生成

1. 概率分布

随机变量:将随机事件的每一种结果赋予一个数字,根据变量是否连续分为两种:连续随机变量和离散随机变量。
离散随机变量:随机变量的取值不连续,例如抛硬币。
连续随机变量:随机变量的取值是连续的,例如一段绳子的长度。
概率分布:用统计图来表示随机变量所有可能结果对应发生的概率。横轴是随机事件所有可能的结果(即随机变量的对应的数值),纵轴是对应每个结果发生的概率。
在这里插入图片描述
我们之所以要将变量分为两种,因为不同类型的变量对于求概率的方法不同。

  • 离散概率分布:关注某一个数值的概率,其分布计算公式用概率质量函数PMF(Probability Mass Function)。常见的分布:伯努利分布、二项分布、几何分布、泊松分布。
  • 连续概率分布:在连续概率分布无法计算所有数值的概率,一般计算公式用概率密度函数PDF(Probability Density Function)。常见的分布:均匀分布、正态分布。

概率分布可以让我们不在需要记住大量繁杂的数据,只需要利用对应的概率分布描述数据,记住仅有的几个参数即可,解决实际问题的时候,我们只需要用这几个参数决定的概率分布来计算概率,进而解决实际中的各种问题。

2.数学期望

数学期望 E ( x ) E(x) E(x):是对随机变量预期取值的一种度量。是试验中每次可能结果的乘以其结果的总和。简单说,它是概率中的平均值,可以用期望对比两套方案。公式如下:
E ( x ) = ∑ x f ( x ) E(x) = ∑xf(x) E(x)=xf(x)

  • x:随机变量
  • f(x):随机变量取值为x的概率

那么期望和均值有什么不同呢?

  • 均值:是一个统计量(对观察样本的统计),用来形容样本的。
  • 期望:是针对于随机变量而言的一个量,可以理解为期望就是均值随样本趋于无穷的极限。

3. 方差

方差D(x):是这种风险的度量,即随机变量的变异性。它和描述统计学的方差是一个含义。公式如下:
D ( x ) = ∑ ( x − μ ) 2 f ( x ) D(x)=∑(x−μ)^2f(x) D(x)=(xμ)2f(x)

  • μ = E ( x ) μ=E(x) μ=E(x)
  • f(x):随机变量取值为x的概率
在Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散型分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量的概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变量的概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量的概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值