广义pareto分布_帕累托分布&广义帕累托分布

PDF、PMF、CDF

1. 概念解释

PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

PMF:概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

CDF:累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。

2. 数学表示

2.1 PDF

如果XX是连续型随机变量,定义概率密度函数为$f_X(x)$,用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即

37283ef29725eae40af42392d7a115a6.png

2.2 PMF

如果XX离散型随机变量,定义概率质量函数为$f_X(x)$,PMF其实就是高中所学的离散型随机变量的分布律,即

ef156c7b36c0068749578ce67a6e8763.png

2.3 CDF

不管是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数,有时简称为分布函数。

对于连续型随机变量,显然有:

95dcf244dd03aa3873cea2592c007b5a.png

那么CDF就是PDF的积分,PDF就是CDF的导数。

对于离散型随机变量,其CDF是分段函数,比如举例中的掷硬币随机变量,它的CDF为:

c3e3d1b3ea6113f81a6eb2c7dbda97c1.png

Pareto(帕累托)分布

Survial function 生成函数

The survival function is also known as the survivor function[2] or reliability function.[3]

又称 complementary cumulative distribution function.

2c70841bf5f03f5c05533c1fba0560e3.png

其实就是1-CDF

Pareto distribution

1ae6fce2b1f7e95fbb51d10c7d38c9e0.png

注意形状参数$\alpha$必须是正的!

bdfc0e1a43eacf8829ea60f8e308d676.png

3649826936f63d1dec387a76737c2e7f.png

a11d82a780dd5db527cf2d9b5e91ff62.png

Generalized Pareto distribution

180f201504dc8d8137fed42f16b9c01a.png

注意:形状参数(或者称为尾部指数)$\xi\in(-\infty,+\infty)$!

b31d29d789ec4e880d3e7067ed837c6e.png

因此,GP 分布是指数分布 (k = 0) 和帕累托分布 (k>0) 的广义化。GP 将这两个分布包括在更大的族中,因此可以实现连续的形状范围。

Matlab实现

广义帕累托 (GP) 分布是一种右偏态分布,使用形状参数 k 和尺度参数 sigma 进行参数化。k 也称为“尾部指数”参数,可以为正值、零或负值。

x = linspace(0,10,1000);

plot(x,gppdf(x,-.4,1),'-', x,gppdf(x,0,1),'-', x,gppdf(x,2,1),'-');

xlabel('x / sigma');

ylabel('Probability density');

legend({'k < 0' 'k = 0' 'k > 0'});

d55a45e31722d5793942aca0dfd677f3.png

其他代码见链接!

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
广义Pareto分布(Generalized Pareto Distribution)是一种常用的概率分布模型,它通常用于分析极值现象和极端事件的概率分布。Python提供了许多工具和库来建立和拟合广义Pareto分布的多轴外推模型。 在Python中,可以使用scipy库来拟合广义Pareto分布的多轴外推模型。scipy库中的stats模块包含了许多统计分布的函数,其中包括广义Pareto分布的函数。可以使用该函数来估计样本数据的参数,并进行模型拟合。 首先,需要导入scipy库中的stats模块: ```python from scipy import stats ``` 然后,可以使用stats模块中的`genpareto`函数来拟合广义Pareto分布的多轴外推模型。该函数的参数包括数据、位置参数(loc)、尺度参数(scale)和形状参数(shape)。可以使用拟合函数`fit`来估计这些参数: ```python data = [1.2, 2.3, 3.4, 4.5, 5.6, 6.7] # 样本数据 params = stats.genpareto.fit(data) # 估计参数 ``` 得到参数后,可以使用`genpareto`函数的`pdf`方法来计算概率密度函数的值,或使用`cdf`方法来计算累积分布函数的值: ```python pdf_value = stats.genpareto.pdf(data, *params) # 计算概率密度函数值 cdf_value = stats.genpareto.cdf(data, *params) # 计算累积分布函数值 ``` 此外,还可以使用`rvs`方法生成服从广义Pareto分布的随机变量: ```python rv = stats.genpareto.rvs(*params, size=100) # 生成100个服从广义Pareto分布的随机变量 ``` 综上所述,Python提供了方便的工具和库来建立和拟合广义Pareto分布的多轴外推模型,利用这些工具可以进行统计分析、概率计算和随机模拟等应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值