论文阅读笔记:STAN: Spatio-Temporal Attention Network for Next Location Recommendation


背景

文章考虑用不相邻的用户不连续的访问理解用户行为,利用沿轨迹具有自我关注层的所有登记的相对时空信息,提出了一个时空注意力网络(STAN)做下一兴趣点推荐。

一、需要解决的问题

所有以前的方法都没有有效地考虑非相邻位置和非相邻访问之间的非平凡相关性,且这些模型在建模PIF信息时也存在问题。

二、创新点

1、提出了平衡采样器;

2、用线性插值技术代替空间离散化的分层网格方法,可同时反映连续的空间距离;

三、主要贡献

1、STAN是兴趣点推荐中的第一个模型,明确地结合了时空相关性来学习非相邻位置和非连续访问之间的规律;

2、用线性插值离散化网格空间,恢复空间距离并反映用户的空间偏好,而不仅仅是聚集邻居;

3、为PIF提出了一个双注意力架构。

四、模型

在这里插入图片描述
轨迹时空关系矩阵
两点之间的时间差和地理距离作为直接时空关联信息,i,j两地的时空关系矩阵为:
在这里插入图片描述

候选关系矩阵:
轨迹时空关系矩阵是显示信息,考虑候选时空关系矩阵作为隐式信息。将轨迹中每个访问点与候选集中可能的下一点间的时空关联信息用于下一点预测。计算轨迹内每个访问点之间的时空关联:
在这里插入图片描述

1、模型构成

多模态嵌入模块:multimodal embedding module、self-attention聚集层:self-attention aggregation layer、注意力匹配层:attention matching layer、平衡采样器:balanced sampler

2、模型细节

整个模型分为四个部分。
1)多模态嵌入模块( a multimodal embedding module),学习用户、位置、时间和时空效应的密集表示;

该块由轨迹嵌入层时空嵌入层两部分组成。
用户轨迹嵌入层:将用户、位置和时间编码成潜在表示;将每个用户序列的embedding表示为在这里插入图片描述
其中:
在这里插入图片描述
时空嵌入层:
以每小时和每一百米作为基本单位,映射到一个欧氏空间。
在这里插入图片描述

经过求和,可以得到最终的轨迹嵌入 和候选嵌入:
在这里插入图片描述

2)自我关注聚集层(a self-attention aggregation layer ),其聚集用户轨迹内的重要相关位置,以更新每次登记的表示;
该模块汇总相关的访问地点,并更新每次访问的表示。将最终轨迹E(u)和时空关系矩阵E(△)通过self-attention层,计算得到新的序列S更新表示。
在这里插入图片描述

3)注意力匹配层(an attention matching layer),其根据加权登记表示计算最大概率,以计算每个候选位置对于下一个位置的概率;

给定更新的轨迹表示S(u),候选位置表示E(l),候选时空关系矩阵E(N)。计算每个候选位置成为下一位置的概率:
在这里插入图片描述

4)平衡采样器(a balanced sampler),使用一个正样本和几个负样本来计算交叉熵损失的平衡采样器。

当正负样本不均衡的时候,优化交叉熵损失不再有效。(这是因为损失权重对推动正确预测的动量影响很小)。本文将交叉熵损失中使用的负样本数量设置为超参数s,称为平衡采样器,用于在训练的每一步随机采样负样本
在这里插入图片描述

总结

本文提出了一种时空注意力网络STAN,能够有效学习不相邻非连续访问点之间的时空关联,用单位时空离散化替代空间网格,通过双层结构设计考虑用户访问频率。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值