幂律分布

幂律分布

统计学意义

幂律分布就是常说的马太效应,二八法则,它是统计学中的概念。这种幂律分布概率密度可以表示成以下的形式:
y = α x − γ y=αx^{-γ} y=αxγ
其中,x,y是正的随机变量,α, γ均为大于零的常数。可见,在这种幂律概率分布上,概率越高,占比越小,大占比的分布位于那条长长的尾巴上。

例如: y = 5 x − 2 y=5x^{-2} y=5x2的分布图如下:
Alt

图1 幂律分布

通俗解释1

按照相关统计资料,假设99个成年男性的平均身高为167.1厘米。姚明身高226厘米,若将其纳入样本,则100人的平均身高约为167.7厘米。姚明的个子固然很高,但其身高与167.1厘米的平均身高相比,并不是那么悬殊,故把他纳入样本不会显著提高平均身高。

人类身高服从正态分布,绝大多数人的身高均处于平均值左右,很矮与很高的人在人群中的占比均很小。因此,基于样本的平均身高来估计个体的身高很“靠谱”。换言之,平均身高是一个典型值。若个体的身高等于平均身高,则从身高角度看,其属于“标准人”。

按照相关统计资料,假设99个成年男性的平均财富为15万元。根据2018年福布斯中国富豪榜的数据,某位商界精英身价2387.4亿元。若将其纳入样本,则100人的平均财富约为23.9亿元。亦即,一旦把他加入样本,则每个人都被“平均”成了亿万富翁。

财富平均值23.9亿元当然不是一个典型值,因为除了那位商界精英之外,其余99人的财富均远远小于这个平均值。换言之,从财富角度来看,拥有高达23.9亿元财富的个体不是“标准人”,而是属于人群中占比很少的富豪。对此,19世纪意大利经济学家帕累托很早就发现,人类的财富分布存在“可预料的不均衡”——少数人拥有的财富要远多于大多数人拥有的财富。一般而言,20%的人口几乎拥有80%的社会财富。

就统计推断而言,上述分析表明,计算身高的平均值是有意义的,而计算财富的平均值只会带来误导。究其根源,是因为人类身高服从正态分布,而财富拥有量不服从正态分布。那么,后者到底服从什么分布呢?请再看一则故事。

语言学家齐普夫在1932年发现,绝大多数词很少被使用,只有极少数英文单词被经常使用。实际上,经过长期演化的人类语言符合“最小努力原则”,基本上都具有“使用较少的词汇来表达尽可能多的语义”这一特点。齐普夫的发现被命名为齐普夫定律,成为文献计量学的一大重要定律。显然,与财富分布一样,单词使用频率也表现出很强的集中性。

有趣的是,人们还发现,人口中的姓氏、城市人口规模、论文引用次数、网站访问量、书籍及唱片的销量、战争规模等,其分布无不具有集中性。实际上,它们均服从幂率分布,亦称“长尾”分布。在此分布中,绝大多数个体的尺度都很小,而少数个体的尺度相当大。在数学上,幂律分布是唯一满足无标度特征的概率分布形式。简单理解就是,虽然20%的人口拥有80%的社会财富,但80%的社会财富的80%,又由20%的人口中的20%所拥有。由此推知,极少数超级富翁所拥有的财富很容易超出我们的想象。

幂率分布形成于一种正反馈机制,包括马太效应与网络效应。在日常生活中,幂率分布多呈现为帕累托法则、二八定律、关键少数法则等,其重要的启示是:对一件事情起决定作用的,往往是少数几个因素。因此,我们应抓住“关键少数”,优化决策。


  1. 幂律分布 ↩︎

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 幂律分布(Power Law Distribution)是一种常见的概率分布模型,它描述了许多实际现象中的“长尾”特征,即少数超出预期范围的极端大值数据。 在MATLAB中,可以使用最小二乘法进行幂律分布的拟合。拟合过程分为以下几个步骤: 1. 数据准备:将待拟合的数据准备好,并进行排序。 2. 定义幂律分布模型:定义幂律分布的函数表达式,一般为y = a * x^b,其中a和b是待拟合的参数。 3. 初始参数估计:可以根据经验估计初始参数值。 4. 构建拟合函数:根据幂律分布函数表达式和参数,构建拟合函数。 5. 使用最小二乘法进行拟合:使用MATLAB的拟合函数进行最小二乘法拟合,如fit函数。 6. 拟合结果评估:评估拟合结果的准确性,比如计算残差平方和、确定系数等。 7. 可视化拟合结果:使用plot函数将原始数据和拟合曲线进行可视化展示。 需要注意的是,拟合过程中可能会遇到一些问题,比如数据的范围较小、数据包含大量噪声等,这些都可能导致拟合结果不理想。因此,在进行幂律分布拟合时,需对数据进行预处理和适当的参数调整,以获得更准确的拟合结果。 综上所述,使用MATLAB进行幂律分布的拟合,需要进行数据准备、定义幂律分布模型、初始参数估计、构建拟合函数、最小二乘法拟合、拟合结果评估和结果可视化等步骤。掌握这些步骤,可以对幂律分布进行有效的拟合,并用于实际数据分析和建模中。 ### 回答2: 在Matlab中,可以使用powerlawfit命令来拟合幂律分布。使用该命令,需要提供一个包含从幂律分布中抽样的数据的向量。 首先,需要确保已经安装了Matlab的统计工具箱。然后,使用如下代码拟合幂律分布: ```matlab % 定义数据 data = [1.2, 2.5, 3.8, 4.3, 6.0, 9.1, 10.5, 12.7, 14.9]; % 拟合幂律分布 fit = powerlawfit(data); % 输出拟合结果 disp(fit); ``` 在上述代码中,data是一个包含从幂律分布中抽取的数据的向量。可以根据实际情况提供自己的数据。 通过powerlawfit命令拟合幂律分布后,可以获得一个结构体fit,其中包含了拟合的结果。可以通过disp函数输出fit的结果。 需要注意的是,拟合幂律分布时,需要根据实际问题选择合适的数据,并根据数据的分布特点进行调整。 ### 回答3: 幂律分布是一种常见的概率分布模型,常用于描述非正态分布的数据。在matlab中,可以通过powerlawfit函数来拟合幂律分布。 首先,将需要拟合的数据存储在一个一维向量或矩阵中。然后,使用powerlawfit函数进行拟合。该函数的输入参数包括数据和拟合的范围,可以根据数据的特点进行调整。拟合的结果会返回幂律分布的拟合参数,如幂律指数和比例系数。 示例代码如下: ```matlab % 原始数据 data = [1, 2, 3, 4, 5]; % 幂律拟合 [alpha, xmin] = powerlawfit(data); % 显示拟合结果 disp('幂律指数为:'); disp(alpha); disp('最小概率阈值(分布的最小值)为:'); disp(xmin); ``` 上述代码中,我们首先定义了原始数据data,然后调用powerlawfit函数进行幂律拟合。函数返回的alpha即为幂律指数,xmin为分布的最小值。最后,通过disp函数输出拟合结果。 通过这种方式,我们可以方便地使用matlab来拟合幂律分布,从而更好地理解和分析非正态分布的数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值