人类(行为)动力学(1)——初步了解

人类动力学是研究人类行为统计规律的新兴交叉学科,挑战了传统认为人类行为均匀分布的观点。Barabasi等人发现人类活动时间间隔遵循幂律分布,而非泊松过程。这一发现揭示了人类行为的非均匀性和阵发性,引发了模型构建和理论分析的热潮。模型如基于优先权的排队模型解释了重尾分布的产生,而幂律分布的特性在语言、经济和社会等多个领域都有体现。该领域的研究不断深化,从时间规律扩展到空间规律,从个体行为到组织行为,揭示了复杂系统中人类行为的深层次机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

人类动力学发展史

长久以来,对人类行为的研究吸引了包括心理学、社会学、社会心理学、人类学在内的众多学科的共同关注,得到了大量的定性研究成果。这些研究成果有助于揭示人类行为的普遍规律,以便对其进行有效控制和预测,使人按照一定的社会生产和生活的需要来行动,既能维持社会生活的正常秩序,又能更好地促进社会和人类自身的发展。
由于人是一个系统的存在,而这个系统又可以继续划分为人的个体性和社会性两个子系统,而“整个世界是相互联系的”正是系统理论的一个核心观点,因此利用系统理论和复杂性科学解释人类行为成了一个新兴的研究热点。
过去,当通信运营商需要估计移动通信中占线的电话数量并优化资源配置、交通部门想要模拟交通流量的模式或事故发生频率、以及网络和街区零售业意欲改进仓储和服务设置时,人们往往用齐次泊松过程来描述这些问题。而2005年Barabasi发表在Nature上的一篇文章却显示人类行为的时间规律具有高度的非均匀性:在非常长的时间内可能了无一事,而这些长长的空白与空白之间则被阵发的密集活动所填充。
Barabasi等人的工作开创了“人类动力学”的新研究方向。尽管这个方向问世时间很短,但是由于其理论和应用上的双重价值,很快就吸引了数学、系统科学、统计物理和非线性科学等领域科学家的大量关注,对现实生活、工作中人类活动的大量定量研究成果不断面世,如商业交易、网页浏览、电影点播、在线游戏、手机短信、邮件通信等,均得到了人类行为发生的间隔时间服从幂律分布的结论,且幂指数大多分布在1至3之间。
随着时间的推进,人类动力学研究不断向着多元化方向发展。各个领域学者关注的方向不再仅仅局限在人类行为的时间规律上,而是扩展到了空间规律,特别是人类的迁移规律上;研究的角度也从个体行为层面扩展到了宏观的组织行为层面微观的生理现象层面,更加关注人作为一个复杂系统其内部各个要素之间的联系以及系统与外部环境的相互作用和影响。更重要的是,在实证研究的基础上进行了大量的理论分析,提出了多种模型来解释这种非泊松统计特征出现的原因。

人类动力学的基本概念

人类动力学是一门新兴的交叉学科,综合借鉴了数学的原理、物理的方法、系统的思想来对人类行为进行研究,在发现人类行为的统计规律的同时力求寻找表明现象下的深层机制。

人类动力学基础知识

长久以来,由于缺乏现代化的统计工具和方法,出于对问题的简化,人们认为人类行为的发生是均匀的长时间的静默短时间的爆发可被忽略。也就是说人类行为可由泊松过程刻画,即行为发生的时间间隔服从负指数分布事件发生的数量服从泊松分布
随着数据存储能力、数据挖掘算法和分析处理技术的长足发展和广泛应用,人们得以从海量数据中挖掘有用信息。Barabasi在对电子邮件和传统信件的研究中发现人类行为的时间间隔分布并不都是均匀的,而是具有阵发重尾的特征。所谓“阵发(burst)”,是指某一事件常常在短期内频繁出现,尔后又在很长的一段时间里销声匿迹。而“重尾分布(heavy-tailed distribution)”是指一类不存在指数阶矩的分布函数,即
在这里插入图片描述
较为直观的定义是:如果密度函数是以幂指数衰减至0的,则称该分布函数为重尾的。也有将长尾分布称为重尾分布的文献。
在这里插入图片描述
如下图(左图为泊松分布,右图为重尾分布)所示,与泊松分布相比,重尾分布的衰减速度较慢且拖着长长的尾巴,使得出现较大观测值的概率远远高于基于泊松分布的预测,反应在时间间隔的分布规律上即“阵发”特征。
在这里插入图片描述
在人类动力学的实证分析中普遍存在的分布形式是幂律分布及其各种扩展形式。数学上,如果一个随机变量X的密度函数为
在这里插入图片描述
则称X服从幂律分布。其中α是一个常量,称为幂律分布的幂指数或标度参数。幂律分布是一类特殊的重尾分布。现实情况中很少有分布能在整个取值范围内服从幂律分布,并且幂律分布不存在峰值,在幂指数为正值的情况下,概率分布会随x→0并在某最小值xmin以下偏离幂律,而这个最小值不一定那么明显,所以我们常说某分布的尾部服从幂律,或者某变量具有“幂律尾巴”。
幂律分布具有多种多样的表现形式,广泛存在于众多学科领域中。由下图(泊松分布和重尾分布的人类动力学行为模式)可以看出,幂律分布表现出很强的
非均匀性
,这种非均匀性说明不能用一个统一的“标度(scale)”来表征幂律分布所描述的数据集。事实上,幂律分布是唯一具有无标度性质(scale-free)的分布,当密度函数为f(X)=Cx时:
在这里插入图片描述
也就是说,当度量变量x的单位或“标度”变化常数b倍时,分布f(x)的形式不变。
在这里插入图片描述
(a.泊松过程给出的1000个连续事件的序列,每一条竖线代表一个事件发生。b.连续事件的时间间隔,线段在垂直方向的长度对应a中连续竖线间的空白长度。c.给出图a、b的泊松过程中两个连续事件的时间间隔分布,服从指数规律,在半对数坐标下表现为一条直线。d.具有重尾分布的1000个连续事件。e.连续事件的时间间隔,均值与图a中泊松过程的均值相同。f.给出图d、e中具有重尾的时间间隔分布,服从幂律,在双对数坐标下表现为斜率为幂指数相反数的一条直线。)
对式f(X)=Cx两边取对数可以发现InyInx满足线性关系,即在双对数坐标下表现为一条斜率为-α的直线。因此,在实证研究中利用一元线性回归模型和最小二乘法得到二者的经验回归直线方程成为获得yx之间幂律关系的简便方法。但是越来越多的研究发现该方法得到的幂指数与真实值之间可能存在较大差异。对此,可以采用极大似然估计法并按照公式
在这里插入图片描述
来分别计算幂指数及其标准差,并对幂指数进行Kolmogorov-Smirnov检验。
由于统计误差的存在,数据的尾部可能出现较大的波动,我们既可以用“装箱(bining)”的方法来消除这种波动,也可以计算数据的累计分布函数。若原分布f(X)=Cx满足幂律,则其累计分布
在这里插入图片描述
也服从幂律分布,且幂指数比原分布的幂指数小1。使用累计分布不仅可以消除尾部波动,还可以避免难以准确确定装箱宽度的问题,并且对所有数据有较好的使用效果,不丢失任何信息。
对重尾分布研究做出重要贡献的科学家有Zipf和Pareto。1932年,语言学专家Zipf发现如果把单词出现的频率按由大到小的顺序排列,则每个单词出现的频率与它的名次的常数次幂存在如同式f(X)=Cx的反比关系,这种分布就称为Zipf定律。而经济学家Pareto在研究了个人收入X的统计分布后发现大多数的社会财富掌握在少数人手中,个人收入不小于某个特定值x的概率与x的常数次幂存在简单的反比关系:P(X≥x)~x-k,即为Pareto定律。实际上,二者都是简单的幂律函数,Zipf定律是幂律分布在有限值域上的离散形式,而Pareto定律是幂律分布的一种累积形式。
另外,很多分布并不能由单一的幂律分布刻画,而是呈现出分段的形式,需要多个甚至多种分布共同刻画。并且具有宽广尾部的分布不只有幂律分布,还有对数正态分布、广延指数分布和带有指数截断的幂律分布等形式,有些文献还用“漂移幂率(shifted power-law)”来刻画重尾,密度函数为f(x)=C(x+θ),其中参数θ可以控制分布在幂律(θ=0)与指数(θ→无穷)之间自由转换。
需要特别注意的是,目前人类动力学领域的文献中对于“重尾分布”这一概念的使用非常宽泛,也不严格区分重尾分布和幂律分布。一般情况下,那些明显偏离泊松形态、具有宽广尾部的分布都被归为重尾分布,既包括如幂律分布这样的单一分布形式,也包括了如幂律和指数相结合的各种混合分布形式,尽管后者并不严格满足重尾定义中不存在指数阶矩的要求。
由于人类动力学中涉及到的间隔时间、等待时间和逗留时间等主要指标是连续型随机变量,因此上述主要论述的是连续型随机变量的重尾分布和幂律分布。对于复杂网络和人类动力学中涉及到的离散型随机变量的幂律分布的定义可参考最近的文献。

人类(行为)动力学模型简介

在众多领域发现重尾特征的人类行为时空标度律后,这样的重尾特征是如何产生的成为一个亟待解决的重要课题,众多学者从不同角度进行了尝试。Barabasi率先提出了基于优先权的排队模型并引起了广泛的关注和讨论,随后可能产生重尾的其它机制不断被提出,如兴趣、记忆、截止时间、人与人之间的相互作用和影响、不同的任务类型和排队规则等。

基于优先权决策的排队模型

Barabasi将人每天要做的事情看作一个有L个任务的优先权列表,认为绝大多数由人发起的事件都需要个体评定和区分各项活动的优先顺序,即为每一项任务确定一个优先权x,表示每个任务的紧急程度。给定的任务在列表中的等待时间取决于主体的优先权选择策略,常用的协议先进先出(FCFS)随机选择(RS)最高优先权优先(HPF)三种,Barabasi认为第三种协议是最重要的,并由此建立人类动力学模型如下:

  • 1)每个个体有一个包含L个任务的列表,每个任务都赋予一个优先权参数xi,其中i=1,2,……,L,优先权参数由均匀分布ρ(x)生成;
  • 2)每个时间步,个体以p的概率选择一个优先权最高的任务执行,以1-p的概率随机选择一个任务执行,一个任务完成之后将从任务列表中删除并加入一个新的任务。这样,模型在p→1时相当于确定型的先进先出协议,而当p→0时相当于随机型的随机选择协议。

随后该模型得到了精确解析,模拟显示,当队长不可变或可变时,该模型可以产生幂律的等待时间分布(指数分别为1和1.5),且所得分布与ρ(x)无关。实际上,ρ(x)在任务到达时分配完毕后就不再变化,因此那些具有较小优先权的任务会长时间停留在任务列表中久久得不到服务从而产生等待时间的重尾。
以上模型只考虑了产生重尾的最基本的条件,即具有优先权决策的任务队列,我们可以通过添加新的条件或者改变模型参数的取值使其适应不同的实际情况。例如,现实中人们的许多任务即便优先权再低也是不可能无限期的等待的,随着时间的推移必定进入一种“不能在拖”的状态,这种情况可以通过引入一种优先权指数随着时间t单调增加的老龄化机制来解决。这种情况下低优先权的任务会在长时间等待后具有较高的优先权,同时系统服务率也是关于优先权指数的单调递增函数,从而解析得到了系统中等待任务数量的幂律分布。另外,任务执行的截止时间和等待成本也是十分贴近实际的改进,关于前者将在下一小节中专门介绍。
另外,鉴于人能够记住的优先权数目以及优先权列表的长度是有限的,因此原始模型假设任务的到达率λ和服务率μ相等,从而任务列表长度L为常数,此时的幂律分布的指数为1,而在队长可变的情况下可以产生指数为1.5的间隔时间的幂律分布。后一种情况下,任务的等待时间分布P(τ)随λ和μ的取值不同而有所差别:λ≥μ时,P(τ)——τ-3/2;而λ<μ时,P(τ)——τ-5/2e-τ/τ0(其中τ0是一个特征时间长度)。说明复杂系统在服务强度为1的临界值两侧表现出不同的标度特征。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值