UniCRS笔记

最新推荐文章于 2024-10-06 21:18:37 发布

hugh_123

最新推荐文章于 2024-10-06 21:18:37 发布

阅读量1k

点赞数 26

分类专栏：对话推荐系统文章标签：笔记

本文链接：https://blog.csdn.net/2401_87457082/article/details/142690232

版权

1 篇文章 0 订阅

订阅专栏

UniCRS

模型统一性：提出了一个统一的模型UniCRS，它将推荐和对话模块整合到一个框架中，而不是将它们作为独立的部分处理。
知识增强的提示学习：用知识增强提示学习范式重新制定了对话与推荐两个子任务,设计计了多个有效的提示来支持这两个子任务，其中包括由预训练的语义融合模块生成的融合知识表示、任务特定的软标记和对话上下文。
响应模板：将对话模块生成的响应模板作为推荐任务提示的一部分，增强了两个子任务之间的信息交互。

在这里插入图片描述

RoBERTa作为历史对话编码器，生成word Embedding （此模块参数固定）,将上下文的word Embedding冰洁在一起后形成word Embedding matrix, $\ T = [h^T_1 ; . . . ; h^T_{n_W} ] \in \mathbb{R}^{T \times n_W }$ 。
RGCN作为知识图谱（KG）中实体的编码器，生成Entity Embedding。将对话历史中提及的实体编码并拼接在一起后形成entity embedding matrix, $[h^E_1 ; . . . ; h^E_{n_E} ] \in \mathbb{R}^{E \times n_E }$ 。

Word-Entity Semantic Fusion模块弥合单词和实体之间的语义鸿沟，我们使用交叉交互机制，通过双线性变换将这两种语义表示关联起来。
$A=T^TWE \newline \widetilde{T}=T+EA \newline \widetilde{E}=E+TA^T$
$A$ 是亲和矩阵, $W$ 是转换矩阵， $\widetilde{T}$ 是语义融合后的词表示, $\widetilde{E}$ 是语义融合后的词表示，
Pre-training the Fusion Module利用对话中的自监督信号来进行预训练(参数为 $\Theta _{fuse}$ )，进一步实现实体与对话的语义融合。预先准备 $\widetilde{C}_{pre} = [\widetilde{E};C;R]$ , $C$ 表示对话上下文的explicit tokens， $R$ 表示回答的explicit tokens。对于实体 $e$ 的预测为：
$Pr(e|\widetilde{C}_{pre}) = Softmax(h_u \cdot h_e)$
其中 $h_u = Pooling[f (\widetilde{C}| Θ_{plm}; Θ_{fuse})]$ , $h_e$ 是于一融合后的实体表示, $Θ_{plm}$ 参数固定。

虽然基本 PLM 是固定的，没有进行微调，但我们可以设计特定的提示（prompt）以适应 CRS 的推荐和对话任务。（两个子任务共用同一个参数固定的DialoGPT）

此模块旨在生成信息性话语，以阐明用户偏好或回复用户的话语。提示（prompt）设计主要增强文本语义，以便更好地理解和生成对话。

The Prompt Design：生成回复的提示（prompt）: $\widetilde{C}_{gen} \rightarrow [\widetilde{T}; P_{gen}; C]$ , $P_{gen}$ 为子任务特定的都PLM指引的Prompt（潜向量）， $C$ 为原始对话记录（显示token）。
Prompt Learning：
$L_c(\Theta_{\text{conv}}) =- \frac{1}{N} \sum_{i=1}^{N} \log Pr(R_j | \widetilde{C}^{(j)}_{gen}; \Theta_{\text{conv}}) \newline= - \frac{1}{N} \sum_{i=1}^{N} \sum_{j=1}^{l_i} \log Pr(w_{i,j} | \widetilde{C}^{(j)}_{gen}; \Theta_{\text{conv}};w<j)$
- $L_c$ 是对话任务的损失函数。
- $Θ_{conv}$ 是对话任务的参数。
- $N$ 是训练样本的数量。
- $l_i$ 是第 i 个样本的目标序列长度。
- $w_{i,j}$ 是第 i 个样本中第 j 个位置的词。
- $w < j$ 表示第 j 个位置前面的单词
具体来说，我们在基本 PLM 的词汇表 $\mathcal{V}$ 中添加了一个特殊标记 [ITEM]，并将响应中出现的所有项目替换为 [ITEM] 标记。在每个时间步长，PLM 都会从原始词汇表生成特殊标记 [ITEM] 或通用标记。生成推荐物品后，所有槽位都会被填满。

此模块旨在预测用户可能感兴趣的实体。提示设计主要增强了用户偏好语义，以期预测出更满意的推荐。

The Prompt Design：生成回复的提示（prompt）: $\widetilde{C}_{rec} \rightarrow [\widetilde{E}; P_{rec}; C;S]$ , $P_{ren}$ 为子任务特定的都PLM指引的Prompt（潜向量， $C$ 为原始对话记录（显示token）,S为回复模板（显示token）。
Prompt Learning：
$L_r(\Theta_{\text{rec}}) = - \sum_{i=1}^{N} \sum_{j=1}^{M} [ y_{i,j} \log Pr_j(i) + (1 - y_{i,j}) \log (1 - Pr_j(i)) ]$
- $L_r$ 是推荐任务的损失函数。
- $Θ_{rec}$ 是对话任务的参数。
- $N$ 是训练样本的数量。
- $M$ 是每个样本可能推荐的项目总数。
- $y_{i,j}$ 是一个二元标签，表示项目 j 是否是样本 i的正确推荐。
- $Pr_j(i)$ 为 $Pr(w_{i,j} | \widetilde{C}^{(j)}_{gen}; \Theta_{\text{conv}})$ 的缩写.

数据集：使用了两个公共的对话推荐系统数据集，ReDial和INSPIRED，它们都是关于电影推荐的英文数据集。
基线模型：与多个代表性的对话推荐系统模型和预训练语言模型进行比较，包括ReDial、KBRD、KGSF、GPT-2、DialoGPT、BERT和BART。
评估指标：对于推荐任务，使用Recall@k（k=1,10,50）来评估；对于对话任务，使用Distinct-k（k=2,3,4）评估生成响应的多样性，并进行人工评估来衡量流畅性和信息量。
实现细节：使用DialoGPT-small模型作为基础PLM，并冻结其所有参数。使用AdamW优化器进行训练，设置了不同的批次大小和学习率。