论文解读《DIGMN: Dynamic Intent Guided Meta Network for Differentiated User Engagement Forecasting in Online Professional Social Platforms》
一、摘要
用户参与度预测在设计交互策略以提高用户参与度和增加在线社交平台收入方面发挥着关键作用,用户参与模式差异的一个主要原因是用户的意图不同。论文提出了一种动态意图引导元网络(DIGMN),它显式地建模随时间变化的用户意图,并进行差异化的用户参与度预测。具体来说,从数据挖掘中导出一些可解释的基本用户意图作为先验知识,并在显式建模动态用户意图时引入先验意图。此外,基于动态用户意图表示,论文提出了一个元预测器来执行差异化的用户参与预测。通过对 LinkedIn 匿名用户数据的综合评估, 有F1+2.96% 和AUC+3.48%的收益。
论文下载链接
二、解决方案
2.1、简介
如上图所示,部分用户近期有求职意向,会频繁访问领英求职、求职,一段时间内参与度快速提升。 一些用户使用 LinkedIn 查看行业新闻。 他们的参与度通常保持在较高水平,因为他们会定期查看 LinkedIn 上的行业新闻。 统计数据表明,用户意图可以作为区分用户参与模式的信号。
动态意图引导元网络(DIGMN),显式地建模随时间变化的用户意图,并进行差异化的用户参与度预测。
2.2、方案
2.2.1、基本定义和任务建模
2.2.2、意图挖掘
论文假设每个用户在每个会话中至少有一个意图。用户的意图通常不会被直接观察到,而是隐含在用户的意识中,很难收集到大量带有用户意图标签的用户行为样本,因此使用无监督的方法进行用户意图挖掘。用户的意图影响用户的行为,而用户的行为构成会话中的事件集,这过程类似于使用无监督主题模型 LDA 生成文档。论文将每个会话视为一个文档,将每个事件类型视为一个词,然后应用 LDA 来挖掘基本的用户意图。通过Spark MLlib库的LDA模型大约6百万的session数据进行意图挖掘,为了确定具有语义意义的最佳意图数,采用困惑度作为评估指标,当意图数等于 7 时,LDA 模型的困惑度最小。
这7个主题可以看作是7个基本用户意图,每个意图的含义可以通过构成它们的顶级事件来解释。
2.2.3、动态意图引导元网络(DIGMN)
包含3个主要部分,behavior evolution layer,intent evolution layer,meta-predictor 。
2.2.4、Label设定和评价标准
在实际业务场景中更关注用户参与度的变化,所以论文预测用户参与度的趋势,而不是直接预测用户未来的参与度。
day-level task,三分类,评价标准选择F1-score
session-level task,二分类,评价标准选择AUC
三、实验
3.1、整体实验效果
3.2、Ablation Exp