概率统计Python计算:随机变量的分布函数

在这里插入图片描述
任何随机变量 X X X都有其分布函数(或称为累积分布函数)
F ( x ) = P ( X ≤ x ) , x ∈ ( − ∞ , + ∞ ) . F(x)=P(X\leq x), x\in (-\infty,+\infty). F(x)=P(Xx),x(,+).
例1 向半径为 r r r的圆内任一投掷一个点,求此点到圆心的距离 X X X的分布函数,并计算 P ( X > r / 2 ) P(X>r/2) P(X>r/2)
:显然,这是一个2-维几何概型, X X X的取值范围为 [ 0 , r ] [0,r] [0,r]。当 x < 0 x<0 x<0时, X ≤ x X\leq x Xx是个不可能事件,故 F ( x ) = P ( X ≤ x ) = 0 F(x)=P(X\leq x)=0 F(x)=P(Xx)=0。当 x > r x>r x>r时,根据 X X X的定义, X ≤ x X\leq x Xx是一个必然事件。故 F ( x ) = P ( X ≤ x ) = 1 F(x)=P(X\leq x)=1 F(x)=P(Xx)=1。当 0 ≤ x ≤ r 0\leq x\leq r 0xr时, X ≤ x X\leq x Xx为事件:投掷的点落在以 x x x为半径的圆内,故 F ( x ) = P ( X ≤ x ) = π x 2 π r 2 = x 2 r 2 F(x)=P(X\leq x)=\frac{\pi x^2}{\pi r^2}=\frac{x^2}{r^2} F(x)=P(Xx)=πr2πx2=r2x2。于是, X X X的分布函数为
F ( x ) = P ( X ≤ x ) = { 0 x < 0 ( x r ) 2 0 ≤ x ≤ r 1 x > r . F(x)=P(X\leq x)=\begin{cases}0&x<0\\\left(\frac{x}{r}\right)^2&0\leq x\leq r\\1&x>r\end{cases}. F(x)=P(Xx)= 0(rx)21x<00xrx>r.
P ( X > r / 2 ) = 1 − P ( X ≤ r / 2 ) = 1 − F ( r / 2 ) = 1 − 1 / 4 = 3 / 4 P(X>r/2)=1-P(X\leq r/2)=1-F(r/2)=1-1/4=3/4 P(X>r/2)=1P(Xr/2)=1F(r/2)=11/4=3/4
在Python中定义数学函数,作为自变量的参数可以是numpy的array数组类型,算得的函数值也构成一个数组。由于numpy拥有大量对数组的高效操作,故对定义分段函数带来很多方便。此外,这样定义的数学函数更便于用matplot包中的工具绘制其图形。下列Python代码定义本例中随机变量 X X X的分布函数(累积概率函数)并用以计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)(假定r=2)。

import numpy as np                  #导入numpy
def cdf(x, r):
    if type(x)!=type(np.array([])):	#非数组类型
        x=np.array([x])				#凑成统一的数组类型
    y=np.zeros(x.size)				#函数值初始化为0
    d=np.where((x>=0)&(x<=r))		#x中介于0~r的部分
    y[d]=(x[d]/r)**2				#x介于0~r对应的函数值
    d=np.where(x>r)					#x中大于r的部分
    y[d]=1							#x中大于r对应的函数值
    if y.size==1:					#单一函数值
        return y[0]
    return y						#数组型函数值
print('P(X>r/2)=%.4f'%(1-cdf(x=1/2, r=2))

程序的第1行导入numpy包。为使函数既能计算单一自变量对应的函数值又能计算对应一组自变量值对应的函数值,第3~4行的if语句对单一自变量转换成数组类型,以便统一处理。第5行调用numpy的zeros函数产生一个元素均为0的数组,该函数的调用接口为
zeros(size) \text{zeros(size)} zeros(size)
其中参数size指定所产生的元素为0的数组所含的元素个数。在程序的第5行,传递给参数size的值是表示自变量的参数x的元素个数,创建一个与x等长的函数值数组y,所有元素初始化为0。
numpy的函数where,可用来计算一个数组中满足指定条件的元素对应的下标形成的序列,其调用接口为
where(condition) \text{where(condition)} where(condition)
参数condition是一个描述数组元素需满足的条件。在程序的第6行中表示自变量的参数x中值介于0~r的元素计算对应的下表序列d。第7行将y[d]中的元素置为函数值 ( x r ) 2 \left(\frac{x}{r}\right)^2 (rx)2。第8行再次将x中值大于r的元素下标序记为d,第9行将y[d]中的元素置为1。第10~11行的if语句返回单一的函数值,第12行返回数组型的函数值。第13行调用以上定义的cdf函数计算概率 P ( X > r / 2 ) P(X>r/2) P(X>r/2)。运行程序输出

P(X>r/2)=0.75

恰为 P ( X > r / 2 ) = 3 / 4 P(X>r/2)=3/4 P(X>r/2)=3/4的值。
Python的matplotlib包含有大量的数据可视化的方法。其中的pyplot对象拥有绘制各种平面图形的函数。下列代码完成绘制以上定义的 X X X的分布函数 F ( x ) F(x) F(x) r = 2 r=2 r=2时的图像。

from matplotlib import pyplot as plt    #导入绘图对象pyplot
import numpy as np                      #导入numpy
x=np.linspace(-0.5, 2.5, 256)           #设置自变量数组
r=2										#设置圆盘半径r为2
y=cdf(x, r)                             #计算函数值y
plt.plot(x, y)                          #绘制y=F(x)的图像
plt.show()                              #展示图形

程序的第1行导入matplotlib包中的pyplot。第3行调用numpy的linspace函数设置表示横坐标上的绘图范围,也就是函数 y = F ( x ) y=F(x) y=F(x)的自变量取值范围的数组。该函数的调用接口为
linspace(start, stop, num) \text{linspace(start, stop, num)} linspace(start, stop, num)
其中参数start和stop分别表示取值的起点和终点,num表示介于start和stop之间的等分点的个数。例如,程序第3行中linspace(-0.5,2.5,256)表示创建一个含有256个元素的数组x,这些元素的最小值为start,最大值为stop,相邻元素是等差的。第4行设置圆形区域半径r为2,第5行调用前面程序定义的函数cdf,传递x和r,计算cdf(x)得到的数组存于y。第6行调用pyplot的plot函数绘制函数 y = F ( x ) y=F(x) y=F(x)的图像。该函数的调用接口为:
plot(x, y) \text{plot(x, y)} plot(x, y)
其中,参数x表示横坐标的取值,y表示对应的函数值。运行程序,第7行展示如下图形。
在这里插入图片描述
写博不易,敬请支持:
如果阅读本文于您有所获,敬请点赞、评论、收藏,谢谢大家的支持!
返回《导引》

  • 4
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散型分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望和方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学中随机变量概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值