详解幂律分布,以及用于重尾分布的Python库powerlaw的使用

48 篇文章 38 订阅 ¥29.90 ¥99.00
36 篇文章 69 订阅 ¥29.90 ¥99.00

总述

具有长尾特征的分布往往一目了然,但实际拟合过程却可能遇到各种各样的问题。本文将为读者介绍2014年由新加坡科技设计大学和麻省理工研究者联合发布的python库:powerlaw,专门适用于幂律等长尾特征分布的拟合,解决拟合烦恼。

期刊来源:PLOS ONE
论文标题
powerlaw: A Python Package for Analysis of Heavy- Tailed Distributions
论文网址
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0085777

幂律分布简要回顾

幂律分布作为长尾分布的一种,满足图片可以用来印证生活中很多有趣的现象,比如最为大家熟知的“二八定律”“富者越富”等等。早在上世纪早期就先后有克莱伯定律、Zipf定律等幂律现象的发现,而千禧年之际BA无标度网络的正式提出更是掀起一波“幂律热潮”,大家越来越接受“幂律分布是复杂系统中的普适现象”这一观点。

在这里插入图片描述
图1. 人们常说“20%的人掌握着80%的财富”就是典型的幂律分布,其具有尖峰、长尾特征。

幂律分布的概率分布函数为:

  • 2
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
幂律分布是一种经典的长尾分布,其在自然界、经济学、社会学等领域都有广泛应用。幂律分布的好处是其能够捕捉到少数大的值对整体的影响,所以在实际应用中十分重要。Python中有多种库可以用于幂律分布检验,包括Powerlaw、Scipy等等。 其中Powerlaw库提供了方便的幂律分布拟合和检验工具。使用Powerlaw库进行幂律分布检验的步骤如下: 1. 导入Powerlaw库和需要分析的数据。(以下例子用的数据是随机生成的) ```python import powerlaw import numpy as np data = np.random.power(3, 1000) ``` 2. 创建Powerlaw实例并拟合数据。 ```python pl = powerlaw.Fit(data) ``` 注意:如果出现ValueError: Not enough data, long enough sequences, or precision too low to fit power law,则说明数据不足以进行拟合,需要增加数据量或使用更精密的方法。 3. 输出拟合结果和R-squared值。 ```python print(pl.alpha) print(pl.xmin) print(pl.r_squared) ``` 其中alpha是拟合出来的幂律指数,xmin是幂律分布的起始点,r_squared是拟合的准确度。需要特别注意的是,拟合的结果应该与实际数据具体情况结合来综合判断。 4. 可以使用pl.plot_pdf()和pl.plot_ccdf()命令绘制数据的概率密度函数和累积分布函数图表。 ```python pl.plot_pdf() pl.plot_ccdf() ``` 5. 可以使用pl.power_law.plot_pdf()和pl.exponential.plot_pdf()命令分别绘制幂律分布和指数分布拟合的概率密度函数图表。 ```python pl.power_law.plot_pdf() pl.exponential.plot_pdf() ``` 通过Powerlaw库的使用,可以较为方便地进行幂律分布的检验和判断,有助于对研究领域中的数据分布有更为深入的理解。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值