幂律分布(Power Law distruibition): Zipf定律与Pareto定律都是简单的幂函数,我们称之为幂律分布;还有其他形式的幂律分布,像名次- 规模分布、规模- 概率分布,这四种形式在数学上是等价的,其通式可写成 ,其中x, y是正的 随机变量 ,c, r均为大于零的 常数 . 这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大. 对上式两边取 对数 ,可知lny与lnx满足 线性关系 lny= lnc - rlnx,也即在 双对数坐标 ( log-log plot) 下,幂律分布表现为一条斜率为幂指数的负数的直线,这一线性关系是判断给定的实例中随机变量是否满足幂律的依据。 判断两个随机变量是否满足线性关系,可以求解两者之间的相关系数;利用一元线性回归模型和最小二乘法