题目:Friendship and Mobility: User Movement in Location-Based Social Networks
来源:SIGKDD-2011(数据挖掘顶级会议)
作者单位:斯坦福大学(Eunjoon Cho, Seth A. Myers, Jure Leskovec)
译者:雨梦:http://weibo.com/yumengkk,个人主页:www.upcom.tk
原文:google 学术进行搜索
摘要:
尽管人类的活动具有很高的自由度,但是仍旧受到地理空间和社会关系的限制。通过研究来自两个位置社交网络中用户的位置数据,我们试图为用户的活动建模,探索其固有的规律和特征。分析结论表明:人类的活动是由两类活动组合起来的,其一是时间和空间上的重复活动,其二是同社会关系相关的随机跳跃活动。近距离活动多体现出时间和空间的周期重复特性,同社会关系关联不大;远距离的活动受到社会关系的深远影响。我们发现社会关系可以解释10%~30%的人类活动,而周期性的模式可以解释50%~70%的活动。基于如上发现,我们提出了一种人类活动模型(mobility model)组合近距离的重复活动和基于社会关系的旅行。该模型可以准确的预测人类的活动,比现有的移动模型的效果好几个数量级。
背景及主题:
人类活动具有周期性,比如经常在家和工作地点之间运动;同时,运动也受到社会关系的影响,比如我们会经常去好友推荐的地方旅游。但是,这些假设并没有得到有力的数据模型支持,并不精确。
当前,基于位置服务中人们的签到数据(签到数据中包含一些语义内容,比如同一个坐标表示的一楼咖啡厅还是二楼的酒吧)可以体现出人类的活动模型,但是这些数据非常离散、稀疏;基于位置的社会网络中还保存了好友的朋友关系。同时,传统通信网络中,电话的拨打记录(每个记录包括用户的基站位置)包含了用户较详细但是精度不高的位置。
综上,我们可以获得三类数据:1、用户位置数据(在哪里)2、用户的时间相关信息(去的频率)3、用户移动同社会关系的联系(位置和好友的关系)。以前的工作仅仅关注三个方面的两方面,而我们对三个方面一起进行分析。
实验及结论:
实验数据:1、Gowalla 和 Brightkite两个基于位置的社交网站的数据;
2、欧洲电信200万用户的电话记录轨迹。
实验结论:1、经验性的:人们喜欢去有好友的地方做远距离旅行;惊奇的是,近距离活动不受社会关系的影响。
整体而言:好友关系对移动性的影响远远大于移动性对新的好友关系建立的影响。
电信数据反映出的运动模式同移动社交网络反映的出的模式极其相似。
朋友在同一个位置共同签到的概率同时间密切相关 —— 当一个好友去一个位置签到后,另一个紧随其签到的概率很大,而随着时间差距的增大, 该概率以指数曲线下降。
2、移动模型:(Periodic & Social Mobility Model)在工作期间,人们多在家和工作地点之间活动,我们称其为周期运动(periodic);而周么采用社会模型描述称为社会运动模型(social mobility)。
几个有价值的图表:
对于LBS开发人员而言:人们多在距离自己家近的位置签到。
估计相似性越高,两个人越可能是朋友;好友会经常去相同的地方。
译者评价:
该文章试图对人类的活动进行准确的建模。将社会关系引入建模过程是一个新颖的方法,有很强的科研价值。
然而,我更看重其给出的归纳结果。对于LBS商业系统、推荐系统的开发者而言具有很强的借鉴价值,可以有效的提高好友的推荐准确度,提升促销策略,用户体验。