heavy-tailed distribution(重尾分布)


概念


在概率论中,重尾分布(Heavy-tailed distribution)是一种概率分布模型,它的概率分布的“尾巴”不是收敛于指数形式的。它的尾部比指数分布还要厚。在许多情况下,右边尾部的部分比较受到重视,但左边尾部比较厚,或是两边尾部都比较厚的状况,也被认为是一种重尾分布。

重尾分布又可以分为两个子类型,分别是长尾分布(long-tailed distributions)以及次指数分布(subexponential distributions)。


定义


对于非负随机变量u,其分布函数F(t) 和余分布函数(complementary cumulative distribution )(也被称作尾函数) Fc( t) 分别定义为F(t) = P{u<=t} 和Fc(t) = 1 - F(t) . 当Fc(t) 满足:


时,定义F(t)为重尾分布,其分布函数可以表示为:F( t) = 1 - (β/ t) ^α,其中α,β>=0

这里α(0 <α< 2) 为形状参数,决定分布函数拖尾的严重程度;β为位置参数.

重尾分布

在一个累积分布函数中,一个随机变量 X 的分布状况,在以下状况时,被称为是一个重尾分布。假设:                            \lim_{x \to \infty} e^{\lambda x}\Pr[X>x] = \infty \quad \mbox{for all } \lambda>0.\,


如果以尾部分布函数的方式来呈现时,
\overline{F}(x) \equiv \Pr(X>x) \,


最后可以被写成:
\lim_{x \to \infty} e^{\lambda x}\overline{F}(x) = \infty \quad \mbox{for all } \lambda>0.\,


这相当於一个动差生成函数 FMF(t) ,对所有的t > 0 来说,都是无限的
重尾分布的左尾,与双尾分布,定义相同。


重尾分布意味着可以更大的概率获得很大的值. 因此与弱随机性相反,重尾分布一般表示病态. 增加的各种结果被确定为具有重尾分布,包括收入分布、财务报告、保险支出、网页的参考链接等. 重尾分布的一个特殊的子集是幂律,其意味着概率密度函数是一个幂. 一个技术难题是,不是所有的矩存在于这些分布,这一般意味着它们使用分位数和其它顺序统计学. 这也就是说,中心极限定理不再成立. 但是对于诸如均值,即稳定分布的线性组合,我们获得一个新的标准极限分布.


设X是一个随机变量,F(X)=P[X<x]为它的分布函数,如果当 x->inf 时1 - F(X) ~ 1/(x^a) (a>0) 称X的分布为重尾分布,又称幂律分布


一般来说,服从重尾分布的随机变量X具有较大甚至是无穷大的方差,而且当a<=1时,X的均值也是无穷的。随机变量X会以不可忽略的概率取到非常大的数值,即:大量的小抽样取值和少量的大抽样取值并存。

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值