Modeling Temporal Effects of Human Mobile Behavior on Location-Based Social Networks

文章主要是解决的问题:已知用户的社交关系以及历史签到记录,预测给定时间用户的签到位置。重点提出时间对预测的影响,可以显著提高精度。

数据集:公开Foursquare数据集http://www.public.asu.edu/~hgao16/dataset.html

公开Brightkite数据集http://snap.stanford.edu/data/loc-brightkite.html

对用户移动模式建模(也是对问题的建模):

P(cu = l| t, Hu,t,Su,t)=P(cu = l | r(t), Hu,t, Su,t)P(r(t) | cu = l,Hu,t, Su,t) × P(cu = l | Hu,t, Su,t)

其中cu表示用户u的签到位置,Hu,t表示用户u在时间t之前的签到记录,Su,t表示用户u的好友们在时间t之前的签到记录,r(t)是时间状态函数(为考虑行为周期性设计,按week计算的话,有7个状态;按day计算的话,有24个状态)。P(cu = l | Hu,t, Su,t)是已知用户签到记录,预测用户将在l处签到的概率,单纯的空间建模,这部分研究较多,本文并未对这部分研究,只是直接引用了前人的工作。P(r(t) | cu = l, Hu,t,Su,t)是已知历史记录,以及用户u在位置l签到,预测发生的时间状态,是时间建模,这也是本文的研究重点。

 

P(r(t) | cu = l, Hu,t,Su,t) =αP(r(t) | cu = l, Hu,t) + (1-α)P(r(t) | cu = l, Su,t)

 P(r(t) | cu = l, Hu,t)这部分是反应用户自我偏好,P(r(t) | cu = l, Su,t)这部分反应社交关系

对用户选择的影响,这部分可由下公式计算。

P(r(t) | cu = l, Su,t)= [uiF(u) sim(u, ui) ×P(r(t) | c ui = l, H ui,t)] / uiF(u) sim(u, ui)

这样整个问题的核心转化为,对P(r(t) | cu = l, Hu,t)建模解决。基于用户的签到历史记录分析,规律如下图所示。


对此,给出两种处理方式:

  1. 最简单的统计方式(non-smooth):
  2. 基于混合高斯分布模型:

最后,对于r(t)day或者week的选择问题,给出了一种融合两者的方法:

P(r(t)| cu = l, Hu,t)=P(rd(t), rw(t) | cu= l, Hu,t)=P(rd(t) | cu=l, Hu,t)×P(rw(t) |cu= l,Hu,t)

这样整个问题都予以解决了。实验部分进行了横向(本文模型与文献[2](阅读中的[1])的对比)和纵向的对比(简单统计方法与混合高斯分布模型哪个好?P(r(t) | cu = l, Su,t)的选择是否合理,α如何选择?考虑P(cu = l| t, Hu,t,Su,t)的合理性,对效果有何改进?)。

自我感想:文本的模型非常好,实验部分也很充分。本文的基础假设就是用户的行为都是周期性的,所以其对于那些非周期性的预测必然不准,那么我们的模型是否对用户行为先分类(周期性与非周期性),然后再进行建模。另外,在选择混合高斯分布这一处理方式,是否有更好的选择?最后,模型并未考虑签到的顺序性!!这点是可以改进之处!


  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

阿清陪你聊聊数据分析

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值