文章发现用户的活动规律:在一定地理区域内,周期性活动(占50-70%);对于跳跃性大的签到跟社交关系有关(占10-30%),并且建立用户活动模型用来预测用户的行为。
分析Gowalla数据,发现的一些规律:
- 距离home越远,签到概率越小。但是超过100km时,概率随着距离变化基本不变;
- 好友关系会影响签到,并且强于签到对新好友关系形成的影响;
- 去好友去过的地方,距离越远,效果越强;
- 轨迹线越相似,好友概率越大;
- 用户签到周期性,用香农熵表示,越小,签到规律性越强;
之后对用户活动建模:xu(t)表示用户u在时间t的位置;cu(t)表示用户u在时间t时候的状态,在家=H还是工作=W;zu(t)表示用户u在时刻t的签到种类,=1表示该签到是受社交关系影响的,=0表示使规律性的签到。
Pu[x(t)=x]= P[x(t)=x|zu(t)=1]*P[zu(t)=1] + P[x(t)=x|zu(t)=0]*P[zu(t)=0]
P[x(t)=x|zu(t)=0]= P[x(t)=x] = P[x(t)=x|cu(t)=H]*P[cu(t)=H] + P[x(t)=x|cu(t)=W]*P[cu(t)=W]
文章最后对其进行了评价,给出了几个评价标准和对比标准。
自我感想:文章对用户活动的分析数据以及对用户活动的建模,对我的研究还是有启发左右的。特别是其中的高斯分布的运用,值得深入思考。