基于多尺度随机分布预测(MSDP)的鲁棒用户行为序列表示----论文总结分析

我明天再来学Web渗透

已于 2024-03-20 17:06:01 修改

阅读量1.6k

点赞数 51

文章标签：人工智能数据挖掘分类大数据笔记深度学习

于 2024-03-19 00:20:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73629042/article/details/136821093

版权

目录

论文简介与作者

一句话简介

背景介绍（当前研究的不足）

用户序列分类方法

常用的用户序列分类方法

标记行为预测MBP

下一行为预测NBP

我们的方法

符号定义与公式

随机窗口大小

Constrastive正则化

下游任务预测

对比方法（4条基线）：

论文简介与作者

一句话简介

一种多尺度随机分布预测（MSDP）算法来学习鲁棒的用户行为序列表示

作者

背景介绍（当前研究的不足）

以往的方法（不足之处）：

训练大量未被标注的用户行为序列，使用自监督的随机标记（随机预测/自回归预测一些标记的行为），但是这种并没有考虑到用户行为本身，文本序列遵循人类语言的语言准则，几乎没有噪声和随机信号，随机性低，但用户行为（反复点击，购买）相反。噪声和随机性的干扰，标记行为预测和下一次标记行为预测任务的难度显著增加，影响了学习用户表示的鲁棒性。

新方法

设置自监督学习任务，实现从用户行为序列的鲁棒表示
在训练阶段采用随机策略预测用户在多个不同时段（例如未来5天，10天或30天）的总体行为分布（MSDP）。
引入了对比正则化项（Contrastive Regularization—标记与未标记的相似性最大化）。

用户序列分类方法

常用的用户序列分类方法

标记行为预测MBP
预测序列中的标记，例如[5，13],标记u，预测r是否来自u
下一行为预测NBP
预测𝑘 未来的token[15，18]，最大化了𝑢,预测下一行为 {𝑟1, . . . , 𝑟𝑘 }.
行为序列的整体表示𝑢 通过最大化MBP和NBP的可能性之和来学习。
对比学习建模，扩充原始数据构建自监督信号
权重共享网络，最大化嵌入的相似性

我们的方法

为了避免短期行为噪声，预测一定时间段内的长期用户行为𝑠𝑡 = {𝑥1, 𝑥2, . . . , 𝑥𝑡−1, 𝑥𝑡 }
为了降低复杂性，预测从下一个时间窗口采样的几个用户行为𝑘 天
基于分布一致性假设，最大化Kullback–Leibler散度（之前与未来）
多任务提示训练：我们采用了一种即时训练方法，随机采样不同尺度的预测时间窗口𝑊1, 𝑊2, 𝑊3,，作为模型训练的提示。

符号定义与公式

过程图：

用户行为嵌入—》不同序列模型的相似度提取（正则化）—》随机窗口采样---》分布预测

相似函数

真实值，表示由行为序列表示学习模型生成的输出

随机窗口大小

我们随机采样𝑁 窗口大小𝑊 从连续时域中的均匀分布𝑊 [𝑊𝑚𝑖𝑛,𝑊𝑚𝑎𝑥]

Constrastive正则化

将标记的用户序列的与未标记序列的的余弦相似度最大化

其中，‖·‖2是ℓ2-范数𝑡 ≜ ℎ (𝑓 ( ˆ𝑠𝑡 )) 是随机标记行为序列的隐藏层表示，v𝑡 ≜ ℎ (𝑓 (𝑠𝑡 )) 是未标记序列的行为序列表示𝑠𝑡 .

目标函数

由前面的相似函数和Constrastive正则化函数结果相加，其中𝜆 是控制对比正则化强度的非负系数。

下游任务预测

利用(0,T]时段数据预测，W为随机选取的窗口大小

下流任务，时间，

预测

实验

实验配置

使用具有与特征提取器相同超参数的转换器编码器
使用预训练模型的用户表示向量输出作为输入
使用具有两个完全连接层（512-256）的DNN作为模型结构

数据集

2个数据集：

逾期风险（O-risk）管理数据集，其中下游任务是未来的用户𝑘 天预测Alipay12的逾期风险。该数据集包含用户在支付宝上的所有金融活动，包括消费、贷款和还款等。
电子商务行为数据集天猫，根据90天内用户的购买分布，下游任务：以预测未来用户感兴趣的商品类别。

对比方法（4条基线）：

设置4条基线进行比较

将模型性能与3个经典基线和1个最新基线进行了比较。

MBP和NBP基线（BERT4Rec和PTUM）
两种不同方法的SOTA方法（基于对比学习的无监督用户行为表示方法，与我们最相似的行为分布预测方法）---UserBERT，SUMN，static-DP
Multi-task baselines（Multi-task SUMN，Multi-task Distribution Prediction (MTDP)）
对比正则化消融（CR）

评估指标

ACC（准确性）和KS（Kolmogorov-Smirnov）

结果论述

1.分布预测的影响

2.多尺度随机提示训练的效果

3.收缩正则化的影响

4.工业应用结果

个人总结

训练任务不同：将未来一段时间的行为分布预测作为预训练任务
预训练方法：多尺度随机提示训练（不同尺度窗口提示）（MSDP)
基于对比学习的对比规则化

备注

以上仅为本人对此文章的看法，文章中的“我们”指代论文作者，详细可以自行查看原文章哦~。本人认知、科研水平有限，欢迎交流。

我明天再来学Web渗透

关注

51
点赞
踩
47

收藏

觉得还不错? 一键收藏
0
评论
基于多尺度随机分布预测(MSDP)的鲁棒用户行为序列表示----论文总结分析

一种多尺度随机分布预测（MSDP）算法来学习鲁棒的用户行为序列表示以往的方法（不足之处）：训练大量未被标注的用户行为序列，使用自监督的随机标记（随机预测/自回归预测一些标记的行为），但是这种并没有考虑到用户行为本身，文本序列遵循人类语言的语言准则，几乎没有噪声和随机信号，随机性低，但用户行为（反复点击，购买）相反。噪声和随机性的干扰，标记行为预测和下一次标记行为预测任务的难度显著增加，影响了学习用户表示的鲁棒性。用户行为嵌入—》不同序列模型的相似度提取（正则化）—》随机窗口采样---》分布预测。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。