对于在对数坐标系中出现一条直线而言,三种分布都是可能的:Zipf
,Power-laws
和 Pareto
。这三种分布都是用于描述同一种现象:大量事件是稀少的,而一些小事件确是很普遍的。
例如:成绩非常优异的学生是少数,但是成绩中等的学生却很多。
(1)Zipf
分布
描述事件出现平率
y
与其由下优先级Zipf
模型,事件出现的平率与其优先级
r
成反比:
其中 b 近似为1
(2)Pareto
分布
用于描述大于Pareto
模型,事大于
x
的事件数量与
P{X>x}∼x(−k)
以职员收入为例,千万富翁是少数,而中等收入的人却很多。
(3)Power-laws
分布
与parto
规律不同,Power-laws
分布不仅描述等于
x
的事件数量。按照Power-lays
模型,
即:对于指数为
k
的Pareto
分布,也是指数为Power-laws
分布。
【完】