论文笔记:Efficient and Effective Similar Subtrajectory Search with Deep Reinforcement Learning (子轨迹匹配)

本文探讨了在轨迹数据分析中,如何通过t2vec和DTW计算轨迹相似度,然后引入强化学习(RLS)方法优化子轨迹搜索。RLS利用强化学习策略决定何时分割轨迹,以找到与查询轨迹最相似的部分。实验展示了RLSwithskip的改进效果。
摘要由CSDN通过智能技术生成

1 intro

  • 大多数研究都将轨迹作为一个整体进行分析,忽略了局部相似的问题
    • 考虑数据轨迹 T 和 查询轨迹 Tq (足球比赛数据库中一场完整比赛球员的轨迹 VS 球员某个进球前的移动轨迹)
      • 当作为一个整体考虑时,T与Tq基于某些轨迹相似性度量,它们并不相似
      • 但T的某些部分与查询轨迹非常相似
      • ——>使用传统的相似轨迹搜索查询,尽管其中T一部分与查询轨迹Tq非常相似,T也会被排除
    • ——>在查询过程中,将子轨迹视为基本单元,并且将查询轨迹Tq作为一个整体进行分析

2 问题定义

  •  给定一条数据轨迹 T=<p_1,p_2,\ldots,p_{n-1},p_n>和一条查询轨迹T_q=<q_1,q_2,\ldots,q_m>

    • 相似子轨迹搜索(SimSub)问题是查找一个T的子轨迹T[i, j],其中i和j 属于[1, n],这段轨迹与查询轨迹最为相似

    • \theta(T[i,j],T_q)最大化,θ为相似性度量

3 轨迹相似度指标

 

 4 强化学习匹配子轨迹(RLS)

模型遍历轨迹的每一个点,由强化学习的agent来决策该点是否分割

4.1 强化学习四元素定义

State

一个三元组(\theta_{best},\theta_{pre},\theta_{suf})

  • \theta_{best}:目前为止所有的分割得到的子轨迹与查询轨迹的最佳相似度
  • \theta_{pre}:当前遍历的节点,与前一个分割节点(如果没有,就是第一个点)所构成的子轨迹与查询轨迹的相似度
  • \theta_{suf}:当前遍历的节点,与该轨迹最末端节点构成的子轨迹与查询轨迹的相似度
Action一共有两个action,分割或者不分割,即0或1的action集合
Transition由于在分割轨迹的过程中,当执行一个action后,状态转移概率是未知的,所以此问题没有transition的具体形式
Reward

执行action之后与之前的最佳相似度的差值

  • 如果分割了:\theta_{pre}-\theta_{best}就是reward
  • 如果没有分割:从前一个分割节点到末端节点构成的子轨迹与查询轨迹的相似度-\theta_{best}就是reward

4.2 learning

(1)从数据库中取出 数据轨迹T和查询轨迹Tq
(2)Agent从Environment中获取当前节点的state
(3)Main Network根据Q函数最大化的结果来输出action(分割或者不分割)

(4)Agent做出该action,并与Environment交互

(5)Environment接收到Action后,更新状态S‘

(6)Environment接收到Action后,将相应的reward提供给Agent

(7)agent将(s,a,r,s')送入 replay buffer

(8~10)main network 采样一个batch的experience replay 进行参数更新

5 RLS with skip

  • 为了增加分割决策的效益,在RLS的基础上增加了k个action:skip j 个节点(j=1~k)
    • 跳过一些节点不再进行分割决策
    • 即不会使用网络对其是否分割的决策做计算
    • 跳过后其效果和不分割结果上是完全一样的
  • 比如跳过j个节点,那么分析完是否分割p_i后,需要直接跳到p_{i+j+1},判断他是否需要分割

5.1 举例

6 实验 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UQI-LIUWJ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值