Unsupervised Path Representation Learning with Curriculum Negative Sampling

最新推荐文章于 2024-07-24 16:19:34 发布

Kazeya

最新推荐文章于 2024-07-24 16:19:34 发布

阅读量71

点赞数

文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/Kazeya/article/details/134469874

版权

通用的课程学习框架为Difficulty Measurer （困难程度评估）+ Training Scheduler（训练计划）两部分

在这里插入图片描述

在这里插入图片描述

自主学习：SPL通常采用模型每个样本训练的loss作为衡量该样本学习困难程度的标准。
Transfer Teacher：引入额外的数据集，训练一个Teacher模型。迁移已经训练好的模型来评估的样本的困难程度，可以避免未充分训练的模型评估时的风险
RL Teacher：包含了学生模型和基于强化学习的老师模型，在每一个epoch的训练策略中，RL teacher会根据学生反馈动态选择训练数据。数据选择作为RL的action，学生反馈作为state和reward。

现有的PRL研究通常以有监督的方式学习路径表示
- 首先，它们需要大量标记的训练数据。
- 其次，学习到的路径表示是特定于任务的，例如，对于带有标签的任务来说效果很好，但对其他任务的泛化能力较差。

课程负抽样方法
- 为输入路径生成少量负路径。
  - 该策略没有随机选择其他输入路径作为负路径
  - 首先生成与输入路径有很大不同的路径，因此很容易与输入路径区分开来。
  - 然后，逐渐生成与输入路径越来越相似的路径，因此更难与输入路径区分开来。
路径表示学习方法——互信息最大化
- 全局视图——路径-路径区分器
  - 捕获输入路径与其负路径之间的表征差异
- 局部视图——路径-节点区分器
  - 捕获输入路径与仅出现在其负路径中的节点之间的表征差异

在这里插入图片描述

路径编码器PE
- 输入：路径 $P_i$ 的初始视图 $IV(P_i)$
  - 即每个节点的表征向量
- 输出： $P_i$ 的表征向量 $p_i$
课程负采样
- 策略：
  - 完全不同的随机路径
  - 首尾相同
  - 中间节点逐渐重合
路径-路径分辨器——判断是否来自同一路径
- 输入：一对路径表征 $(p_i,\overline p_j)$
- 正对： $p_i,IV(P_i))$
- 负对： $(p_i,\overline p_j)$
- 目标函数

在这里插入图片描述

- $P_i$是路径集$\mathbb{P}$中的一条路径
- $\mathbb{NP}_i$是$P_i$的负路径集
- $\mathbb{E}$是期望

路径-节点分辨器
- 输入：一对(输入路径表征，节点特征向量)，如 $p_i,\{V_2,V_3,V_5,V_6\})$
- 正对：仅出现在 $p_i$ 的节点向量， $p_i,V_2)$
- 负对：仅出现在负路径的节点向量， $p_i,V_6)$
- 目标函数

在这里插入图片描述

- $\mathbb X$是只出现在输入路径而不出现在负路径中的点的点集，$\mathbb Y$相反

在这里插入图片描述

关注