基于多尺度随机分布预测(MSDP)的鲁棒用户行为序列表示----论文总结分析

目录

论文简介与作者

一句话简介

作者

背景介绍(当前研究的不足)

新方法

用户序列分类方法

常用的用户序列分类方法

标记行为预测MBP

下一行为预测NBP

我们的方法

符号定义与公式 

过程图:

相似函数

随机窗口大小

Constrastive正则化

目标函数

下游任务预测

实验

实验配置

数据集

对比方法(4条基线):

评估指标

结果论述

个人总结

备注


论文简介与作者

一句话简介

一种多尺度随机分布预测(MSDP)算法来学习鲁棒的用户行为序列表示

作者

背景介绍(当前研究的不足)

以往的方法(不足之处):

训练大量未被标注的用户行为序列,使用自监督的随机标记(随机预测/自回归预测一些标记的行为),但是这种并没有考虑到用户行为本身,文本序列遵循人类语言的语言准则,几乎没有噪声和随机信号,随机性低,但用户行为(反复点击,购买)相反。噪声和随机性的干扰,标记行为预测和下一次标记行为预测任务的难度显著增加,影响了学习用户表示的鲁棒性。

新方法

  1. 设置自监督学习任务,实现从用户行为序列的鲁棒表示
  2. 在训练阶段采用随机策略预测用户在多个不同时段(例如未来5天,10天或30天)的总体行为分布(MSDP)
  3. 引入了对比正则化项(Contrastive Regularization—标记与未标记的相似性最大化)

用户序列分类方法

常用的用户序列分类方法
  • 标记行为预测MBP
  • 预测序列中的标记,例如[5,13],标记u,预测r是否来自u
  • 下一行为预测NBP
  • 预测𝑘 未来的token[15,18],最大化了𝑢,预测下一行为 {𝑟1, . . . , 𝑟𝑘 }.
  • 行为序列的整体表示𝑢 通过最大化MBP和NBP的可能性之和来学习。
  • 对比学习建模,扩充原始数据构建自监督信号

  • 权重共享网络,最大化嵌入的相似性

我们的方法
  1. 为了避免短期行为噪声,预测一定时间段内的长期用户行为𝑠𝑡 = {𝑥1, 𝑥2, . . . , 𝑥𝑡1, 𝑥𝑡 }
  2. 为了降低复杂性,预测从下一个时间窗口采样的几个用户行为𝑘
  3. 基于分布一致性假设,最大化Kullback–Leibler散度(之前与未来)
  4. 多任务提示训练:我们采用了一种即时训练方法,随机采样不同尺度的预测时间窗口𝑊1, 𝑊2, 𝑊3,,作为模型训练的提示。

符号定义与公式 

过程图:

用户行为嵌入—》不同序列模型的相似度提取(正则化)—》随机窗口采样---》分布预测

相似函数

真实值,表示由行为序列表示学习模型生成的输出

随机窗口大小

我们随机采样𝑁 窗口大小𝑊 从连续时域中的均匀分布𝑊 [𝑊𝑚𝑖𝑛,𝑊𝑚𝑎𝑥]

Constrastive正则化

将标记的用户序列与未标记序列的余弦相似度最大化

其中,‖·‖2是ℓ2-范数𝑡 ≜ ℎ (𝑓 ( ˆ𝑠𝑡 )) 是随机标记行为序列的隐藏层表示,v𝑡 ≜ ℎ (𝑓 (𝑠𝑡 )) 是未标记序列的行为序列表示𝑠𝑡 .

目标函数

由前面的相似函数和Constrastive正则化函数结果相加,其中𝜆 是控制对比正则化强度的非负系数。 

下游任务预测

利用(0,T]时段数据预测,W为随机选取的窗口大小

下流任务,时间

预测

实验

实验配置
  1. 使用具有与特征提取器相同超参数的转换器编码器
  2. 使用预训练模型的用户表示向量输出作为输入
  3. 使用具有两个完全连接层(512-256)的DNN作为模型结构
数据集

2个数据集:

  1. 逾期风险(O-risk)管理数据集,其中下游任务是未来的用户𝑘 天预测Alipay12的逾期风险。该数据集包含用户在支付宝上的所有金融活动,包括消费、贷款和还款等。
  2. 电子商务行为数据集天猫,根据90天内用户的购买分布,下游任务:以预测未来用户感兴趣的商品类别。
对比方法(4条基线

设置4条基线进行比较

将模型性能与3个经典基线和1个最新基线进行了比较。

  1. MBP和NBP基线(BERT4Rec和PTUM)
  2. 两种不同方法的SOTA方法(基于对比学习的无监督用户行为表示方法,与我们最相似的行为分布预测方法)---UserBERT,SUMN,static-DP
  3. Multi-task baselines(Multi-task SUMN,Multi-task Distribution Prediction (MTDP))
  4. 对比正则化消融(CR)
评估指标

ACC(准确性)和KS(Kolmogorov-Smirnov)

结果论述

1.分布预测的影响

2.多尺度随机提示训练的效果

3.收缩正则化的影响

4.工业应用结果

个人总结

  1. 训练任务不同:将未来一段时间的行为分布预测作为预训练任务
  2. 预训练方法:多尺度随机提示训练(不同尺度窗口提示)(MSDP)
  3. 基于对比学习的对比规则化

备注

以上仅为本人对此文章的看法,文章中的“我们”指代论文作者,详细可以自行查看原文章哦~。本人认知、科研水平有限,欢迎交流。

  • 51
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值