【论文笔记】跨域推荐(CDR)

DTCDR(2019)

论文解读系列第一篇:CIKM-19 论文 DTCDR - 知乎 (zhihu.com)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-a3F3e4r1-1626967003304)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720160702083.png)]

  • 传统的跨域推荐都是利用源领域(Source domain)的丰富数据来提升单个目标领域(Target domain)的推荐准确度,即Source→Target。而源领域的推荐准确度没法直接通过现有的CDR方法来提升,因为没法直接改变现有的知识迁移方向,即没法从Source→Target变成Target→Source,否则会产生**“消极迁移”(Negative Transfer)的问题**。本论文中以两个域的共同用户或者共同商品作为桥梁,来实现双向的知识迁移,从而同时改善两个领域的推荐准确度。

  • 嵌入层中,本论文除了常用的评分信息以外,还利用了其它多源的文本信息,如评论文本,标签,用户简介,商品详情。该论文使用Doc2Vec模型来处理这些文本信息,获取用户和物品的文本表示(document embedding)。此外,该论文改进了NeuMF和DMF两个模型,并分别获取用户和物品的评分表示(rating embedding)。

  • 合并层中,使用max-pooling策略分别合成共同用户分别来至领域A和B的文本以及评分信息。接着使用三种不同的合并策略(Combination operators,具体的是指average-poolingmax-pooling,以及Concatenation来合成文本以及评分信息。==通过嵌入层和合并层,优化了领域A和B中共同用户的特征表示,并同两个领域分别的物品特征表示一起作为模型层的输入。==在模型层,使用了全连接的多层感知器(MLP)来学习用户和物品之间的非线性关系,并最终得到喜好预测(Score)给输出层。

DDTCDR(WSDM-2020)

DDTCDR: Deep Dual Transfer Cross Domain Recommendation (aisoutu.com)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zui1PAVG-1626967003307)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720152547405.png)]

  • 以前提出的跨领域模型没有考虑到用户和项目之间的双向潜在关系。此外,它们不明确地建模用户和商品特征的信息,而仅利用用户评级信息进行推荐。本论文采用隐性嵌入方法,可以从数据记录中提取潜在的用户偏好,并有效地建模用户和项目特征。

  • 作者建议使用两个组件来建模用户偏好:捕获用户交互并预测用户在目标域中的行为的域内偏好和利用源域用户动作的跨域偏好。引入了传递率α作为超参数,它代表了在预测用户偏好时两种成分的相对重要性。在域对(A, B)中估计用户评分如下:

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Fb8nxneE-1626967003308)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720153455663.png)]

  • 利用深度双迁移学习机制实现用户偏好的双向迁移,该算法学习了两个域的潜在正交映射函数,既能保留用户偏好的相似性,又能有效地计算出反向映射函数。

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zJ47lZXt-1626967003310)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720153804309.png)]

GA-DTCDR(IJCAI2020)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tqd9T0HL-1626967003311)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210720105434730.png)]

  • 此前的最好方法往往只考虑了用户-商品间的联系,而忽略了用户-用户以及商品-商品间的联系。本论文通过构建异构图(heterogeneous graph)考虑了用户-商品间的联系(基于评分),还考虑了用户-用户以及商品-商品间的联系(基于内容相似性),然后通过 graph embedding technique (Node2vec)利用异构图生成相应的 user embedding matrix U 和 item embedding matrix V,这样能够更准确地捕捉到用户和物品的特征。

  • 在融合共同用户/物品的embeddings时,此前的最好方法使用固定的合成策略,比如 average-pooling, max-pooling,,and concatenation本论文使用 element-wise attention networks 替代之前固定的合成策略,通过自注意力机制让机器自动学习到如何从本域的user以及common user中提取特征,也就是利用其他域的user特征来帮助生成本域的user特征。

2 小知识点

ACDN(WWW-2020)

1 核心思想

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C98z29aQ-1626967003312)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210721163634121.png)]

  • 对于衣服鞋子这种仅商品图片就包含了大量信息的商品来说,商品图片的特征是十分重要的。而用户的审美偏好往往是独立于领域的,比如一个喜欢hiphop风格的顾客,在购买衣服,鞋子,项链等商品时往往也会选择更偏向hiphop风格的产品。因此,视觉信息可以在提高外观优先推荐产品的性能方面发挥重要作用本论文通过捕获用户独立于领域的审美偏好,利用新颖的审美特征进行跨领域推荐

  • 使用ILGNet来提取产品图片的局部以及宏观审美特征

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5o4NMdWX-1626967003313)(C:\Users\86525\AppData\Roaming\Typora\typora-user-images\image-20210721164440413.png)]

2 小知识点

最新综述(IJCAI-2021)

论文解读系列第十六篇:IJCAI 2021–跨域推荐(Cross-Domain Recommendation)的最新综述 - 知乎 (zhihu.com)

1 背景介绍

  • 基于协同过滤技术(Collaborative Filtering,CF)(3条消息) 个性化智能推荐(协同过滤算法)技术研究_zolalad的专栏-CSDN博客的推荐系统,都多多少少受到数据稀疏的影响
  • 特别对于新用户或者新产品**(Cold-Start,冷启动问题)**来说,由于在系统内还没有产生任何的交互信息(评分、评论等等),推荐的精度会比较低
  • 跨域推荐的提出就是为了解决这个数据稀疏问题。基本思路是利用**丰富领域(richer domain又称为source domain)的较为丰富训练数据来提升稀疏领域(sparser domain又称为target domain)**的推荐精度。
  • 领域(domain)的定义:
    • 内容层级相关性(content-level relevance):两个或多个领域中,用户之间或产品之间存在共同的内容或者特征(例如关键字、标签)。但是这些领域不存在共同的用户或者产品。例如:亚马逊音乐(Amazon music,音乐相关)和奈飞(Netflix,电影相关)。
    • 用户层级相关性(user-level relevance):两个或多个领域中,存在共同用户但是产品层级不同。产品层级的不同又可以细分为属性层级(attribute-level)的不同(即类型相同(例如图书)但是属性不同,例如教科书、小说、自传等等)和类型层级(type-level)的不同(例如图书、电影、音乐、服装等等)。
    • 产品层级相关性(item-level relevance):两个或多个领域中,存在共同产品但是用户不同。例如:MovieLens和奈飞,都是电影相关的系统,存在大量相同的电影,但是用户不同,或者很难识别用户一致性。这种类型在一些文献里又被称为cross-system recommendation(跨系统推荐)。

2 综述动机

  • 近些年来,在跨域推荐领域出现了一些新的或愈发明显的挑战,例如:
    • 特征映射问题
    • 嵌入(embedding)优化问题
    • 负面迁移问题(negative transfer)
  • 随着应用场景的拓展,跨域推荐也出现了一些新的方向:
    • 双目标跨域推荐(dual-target CDR)
    • 多目标跨域推荐(multi-target CDR)

3 不同的跨域推荐场景以及挑战

  • **场景1. 单目标跨域推荐(single-target CDR):**传统的跨域推荐主要是针对的单目标跨域推荐(single-target CDR),即利用丰富领域(源领域,source domain)来提升稀疏领域(目标领域,target domain)的推荐精度。根据上面‘领域’的不同定义,单目标跨域推荐可以细分为以下三个应用场景:

    preview

  • 这个场景下,研究人员将面临如下三个挑战:

    • 构建基于内容的关系

    • 生成准确的用户/产品嵌入表达(embeddings)或者评价模式(rating patterns)

    • 学习准确的映射关系:领域之间embedding或rating pattern的迁移对应关系。

  • **场景2. 多领域推荐(Multi-Domain Recommendation):**在单目标跨域推荐中,有一个研究分支,即多领域推荐(Multi-Domain Recommendation)。这个分支主要针对来之多个领域的特定用户集中用户,推荐来之多个领域的特定产品,本质上这也是single-target CDR,因为推荐的目标是特定一个集合(用户集合)。因此,本综述认为这个研究方向还是single-target CDR的一个分支。

    preview

  • **场景3. 双目标跨域推荐(dual-target CDR):**这是一个新的跨域推荐场景,即同时利用两个领域的数据来同时提升两个领域的推荐精度。这个场景面临以下两个新的挑战:

    • 构建一个可行的双目标跨域推荐的框架

    • 各领域之间的对应关系,优化用户/产品的嵌入表达(embeddings)

  • **场景4. 多目标跨域推荐(Multi-target CDR):**这也是一个新的跨域推荐场景,即同时利用多个领域的数据来同时提升多个领域的推荐精度。这个场景面临以下挑战:

    • 避免负面迁移(negative transfer),这个问题随着越来越多领域的加入会愈加严重。

img

4 相关的研究进展

  • 现有的跨域推荐方法主要划分如下图:

preview

5 可用数据集合

preview

6 未来研究方向

  • 异质化跨域推荐:现有跨域推荐的假设前提是跨域的信息是同质的,但是实际应用场景中,存在跨域的异质信息。
  • 序列化跨域推荐:跨域推荐系统也和传统推荐系统一样,面临如何序列化地给用户/产品建模。
  • 隐私保护的跨域推荐:现有的跨域推荐方法忽略了信息孤岛的问题。而实际应用场景,用户敏感信息是无法直接跨域分享的。
  • 另外,数据集稀疏程度、领域间的重叠规模(overlap scale)、以及领域间的关联度,如何分别影响跨域推荐的性能?这些问题同样也值得进一步研究。

7 结论

近些年,随着深度神经网络以及图学习的发展,跨域推荐越来越受工业界、学术界的关注。本篇综述分别从单目标跨域推荐、多领域推荐、双目标跨域推荐、以及多目标跨域推荐来系统性地分析、总结现有跨域推荐方法。综述的最后,给出了三个未来值得研究方向以供读者参考,并希望这些方向能得到进一步的研究,最终解决困恼推荐领域多年的问题—数据稀疏问题。

  • 5
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
### 回答1: 基于异质图嵌入的跨域推荐可以通过以下步骤实现:首先,将不同域的数据表示为异质图,然后使用图嵌入算法将异质图嵌入到低维向量空间中,最后通过相似度计算实现跨域推荐。具体实现可以使用深度学习模型,如图卷积网络(GCN)等。 ### 回答2: 基于异质图嵌入的跨域推荐是指在不同域或领域下的推荐系统中,利用异质图嵌入方法来实现推荐任务。 要实现基于异质图嵌入的跨域推荐,可以按照以下步骤进行: 1. 数据准备:收集并整理不同域或领域的相关数据,包括用户、物品和关系信息。这些数据应该以异质图的形式进行表示,即图中的节点代表不同类型的实体,边代表不同类型的关系。 2. 异质图构建:根据数据准备的异质图,构建对应的图结构,包括节点和边的类型,以及它们之间的关系。例如,可以将用户和物品分别作为一种节点类型,用户和物品之间的交互行为作为一种关系类型。 3. 异质图嵌入:利用异质图嵌入方法将异质图中的节点和边映射到低维向量空间中。常用的异质图嵌入方法包括HIN2Vec、Metapath2Vec等。这些方法会考虑节点和边的类型信息,以及它们之间的关系,将它们嵌入到向量空间中,以便进行下一步的推荐计算。 4. 跨域推荐计算:利用嵌入后的节点向量进行跨域推荐计算。根据用户的行为和关系信息,计算用户与其他领域或域中物品的相似度,推荐相似度高的物品给用户。可以使用用户-物品相似度计算方法,例如余弦相似度或基于矩阵分解的方法,来计算用户与物品之间的关联程度。 5. 推荐结果生成:根据跨域推荐计算的结果,生成推荐列表或推荐排序。将相似度高的物品推荐给用户,以提供个性化的跨域推荐体验。 总结起来,基于异质图嵌入的跨域推荐主要包括数据准备、异质图构建、异质图嵌入、跨域推荐计算和推荐结果生成等步骤。通过构建合适的异质图结构,并利用异质图嵌入方法将节点和边嵌入到向量空间中,可以实现更准确和个性化的跨域推荐。 ### 回答3: 基于异质图嵌入的跨域推荐是一种利用图嵌入技术来实现不同领域或不同域之间的推荐系统。该方法通过将异质图中的不同节点和边分别表示为向量,然后通过学习节点和边的向量表示来计算节点之间的相似度,从而进行跨域推荐。 具体实现基于异质图嵌入的跨域推荐可以按照以下步骤进行: 1. 数据预处理:首先,需要对异质图中的不同节点和边进行编码,将其转化为数值表示。例如,可以使用独热编码来表示不同类型的节点和边。 2. 构建异质图:根据不同领域或不同域的数据,可以构建一张异质图,其中不同类型的节点表示不同的物品或用户,边表示不同的关系类型。例如,在跨域音乐推荐中,可以将歌曲、用户、专辑等不同类型的节点以及它们之间的关系用边连接起来。 3. 异质图嵌入:通过使用图嵌入技术,将图中的节点和边转化为低维度向量表示。常用的图嵌入算法包括DeepWalk、Node2Vec、LINE等。这些算法通过考虑节点的邻居信息来学习节点的向量表示,以保留节点之间的结构信息。 4. 跨域推荐计算:通过计算不同领域或不同域的节点之间的相似度,可以进行跨域推荐。一种常用的方法是通过计算节点之间的向量余弦相似度来度量它们的相似程度。根据节点之间的相似度,可以为用户推荐在其他领域中类似的物品,或者为物品推荐类似的用户。 5. 评估和优化:最后,需要对跨域推荐的性能进行评估,并进行优化。可以使用评估指标如准确率、召回率、覆盖率等来评估推荐结果的质量,并根据评估结果进行模型的调优和改进。 基于异质图嵌入的跨域推荐方法可以帮助解决不同领域或不同域之间的信息孤立问题,提高推荐系统的多样性和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值