统计学:离散型和连续型随机变量的概率分布

主要随机变量一览表

随机变量概率分布均值方差
一般离散型变量 p(x) xxp(x) x(xμ)2p(x)
二项分布 p(x)=Cxnpxqnx (x=0,1,2,3,n) np npq
泊松分布 p(x)=λxeλx! (x=0,1,2,) λ λ
超几何分布 p(x)=CxrCnxNrCnN nrN r(Nr)n(Nn)N2(N1)
均匀分布 f(x=1ba (axb) a+b2 ba12
正态分布 f(x)=1σ2πe(1/2)[(xμ)σ]2 μ σ2
标准正太分布 f(z)=12πe(1/2)z2 01
指数分布 f(x)=1θex/θ(x>0) μ=θ σ=θ

1. 离散型和连续型随机变量的定义

离散型随机变量(discrete random variable):取值是可数的个值的随机变量, 比如投掷一枚骰子的朝上的点数,可能是1,2,3,4,5,6;比如南京大学四食堂吃饭的人数,可能是0,1,2···。
连续型随机变量(continuous random variable):取值是一个区间中的任意一点(也就是不可数)的随机变量,比如南京大学同学身高。


2. 离散型随机变量的概率分布

  1. 基本概念的公式表达
    均值(期望值expected value): μ=E(x)=xp(x)
    方差(variance): σ=E[(xμ)2]=(xμ)2p(x)
    标准差(standard deviation): σ=σ2
    其中,可以证明到 E[(xμ2)]=E(x)2μ2
    2. 二项分布
    如果进行n次不同的实验,每次试验完全相同并且只有两种可能的结果,这样的实验结果分布情况就是二项分布。最简单的比如投掷一枚硬币,不管进行多少次实验,实验结果都只有正面朝上或者反面朝上,这就是一个简单的二项分布。
    二项概率分布:

    p(x)=Cxnpxqnx (x=0,1,2,3,n)

    其中:n代表n次实验,x表示实验结果为T的次数,q是实验结果为T的概率,q=1-p,表示实验结果为F的概率。
    

    二项分布的
    均值: μ=np
    方差: σ2=npq
    标准差: σ=npq
    二项分布对于结果只有两种情况的随机事件有非常好的描述,属于日常生活中最常见、最简单的随机变量概率分布,在知道某种实验结果概率的情况下,能够很好推断实验次数后发生其中某一结果次数的概率。
    3. 泊松分布
    泊松分布的概率分布,均值和方差:

    p(x)=λxeλx! (x=0,1,2,)

    μ=λ

    σ2=λ

    4. 超几何分布
    超结合分布和二项分布比较相似,二项分布每次实验完全一样,而超几何分布前一次的实验结果会影响后面的实验结果。简单地讲,二项分布抽取之后放回元素,而超几何分布是无放回的抽取。
    超几何分布的概率分布,均值和方差:
    p(x)=CxrCnxNrCnN

    μ=nrN

    σ2=r(Nr)n(Nn)N2(N1)


3. 连续型随机变量的概率分布

  • 概率密度函数(probability density function):
    又称之为频率函数(frequency function),或者概率分布(probability distribution),用来表示连续型随机变量的概率分布情况,一般是一条光滑的曲线。
    1. 正太分布(normal distribution)
    正态分布
    正态分布是统计学中常见的一种分布,表现为两边对称,是一种钟型的概率分布(bell curve),正太分布有一下的特征:


    概率密度函数:

    f(x)=1σ2πe(1/2)[(xμ)σ]2

    其中, μ 是正太随机变量的均值;
    σ 是标准差;
    π 是圆周率,约等于3.1416···
    e=2.71828

特别的,当 μ=0σ=1 的正态分布,被称为标准正太分布(standard distribution),此时有:

f(z)=12πe(1/2)z2

标准正态分布有对应的标准正态分布表,通过该表可以找到对应值累积的概率。

正太分布转化为标准正态分布:
正太分布 x,μσzz=xμ)/σ

正态分布来近似二项分布
当n足够大的时候,正态分布对于离散型二项分布能够很好地近似。
二项分布

评价正态分布
如何来确定数据是否正态分布,主要有以下几种方法:
1. 图形感受法:建立直方图或者枝干图,看图像的形状是否类似正太曲线,既土墩形或者钟形,并且两端对称。
2. 计算区间 x¯±s,x¯±2s,x¯±3s ,看落在区间的百分比是否近似于68%,95%,100%。(切比雪夫法则和经验法则)
3. IQRsIQR/sIQR/s1.3.
4. 建立正态概率图,如果近似正态分布,点会落在一条直线上。
正态概率图

2. 均匀分布
均匀概率分布(uniform probability distribution)是指连续随机变量所有可能出现值出现概率都相同。
均匀分布
均匀随机变量x概率分布特征:
概率密度函数:

f(x=1ba (axb)

均值: μ=a+b2
标准差: σ=ba12

3. 指数分布
指数概率分布(exponential probability distribution),具有如下特征:
概率密度函数:

f(x)=1θex/θ(x>0)

均值: μ=θ
标准差: σ=θ


更多文章:
概率论中基本概念回顾

  • 11
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
在Python中,可以使用概率论中的随机变量分布来进行统计计算。常见的离散分布包括二项分布和泊松分布,连续性分布包括正态分布、均匀分布和指数分布等。这些分布可以用来计算概率、期望和方差等统计量。 对于正态分布,可以使用scipy.stats库中的norm模块进行计算。例如,可以使用norm.cdf函数计算小于某个值的概率,使用norm.ppf函数计算给定累积概率时的反函数值。代码示例如下: ``` from scipy.stats import norm # 计算小于40的概率 p1 = norm.cdf(40, loc=50, scale=10) # 计算30到40之间的概率 p2 = norm.cdf(40, loc=50, scale=10) - norm.cdf(30, loc=50, scale=10) # 计算小于2.5的概率 p3 = norm.cdf(2.5, 0, 1) # 计算-1.5到2之间的概率 p4 = norm.cdf(2) - norm.cdf(-1.5) # 计算累计概率为0.025时的反函数值 q1 = norm.ppf(0.025, loc=0, scale=1) # 计算累计概率为0.975时的反函数值 q2 = norm.ppf(0.975, 0, 1) print(p1, p2, p3, p4, q1, q2) ``` 对于计算随机变量概率分布的均值和方差,可以使用numpy库进行计算。代码示例如下: ``` import numpy as np # 假设有一个数据框df,其中包含了不合格品数和概率 mymean = sum(df['不合格品数'] * df['概率']) # 计算均值 myvar = sum((df['不合格品数'] - mymean) ** 2 * df['概率']) # 计算方差 mystd = np.sqrt(myvar) # 计算标准差 print(mymean, myvar, mystd) ``` 以上是关于Python统计学随机变量概率分布的一些基本操作和计算方法。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python统计学03——随机变量概率分布](https://blog.csdn.net/weixin_46277779/article/details/126673517)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值