推荐系统学习（五）

最新推荐文章于 2020-11-23 11:03:00 发布

Kai_TJU

最新推荐文章于 2020-11-23 11:03:00 发布

阅读量281

点赞数

分类专栏： RS 文章标签：推荐系统

本文链接：https://blog.csdn.net/weixin_40666595/article/details/90680467

版权

RS 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

CDL-2015年KDD

概述
本文模型
- 图模型
- 过程
公式
评价指标
代码
参考资料

Collaborative Deep Learningfor Recommender Systems

概述

这一篇论文出自香港理工大学王灏博士，论文讲了一种紧耦合的混合式推荐算法。主要是栈式自编码器SDAE通过贝叶斯图方式结合。其实这篇论文和在推荐系统学习（四）中提到的协同话题回归（CTR），在模型设计上飞航的相似。

当前推荐算法主要是基于内容（content_base）、协同过滤（CF）、混合算法。基于内容的推荐依靠用user的评论和item的描述做推荐。CF基于过去的的表现和行为推荐。由于种种原因，收集过去的行为比收集用户画像要容易，但CF又有他的局限性，当打分（rating）很稀疏时，预测精度会下降很厉害，同时，新产品的冷启动也是CF的问题。因此，近年来，混合方法应用比较广。

混合方法又分两种：松耦合方式、紧耦合方式。松耦合方式先处理辅助信息，然后，用它为CF提供特征。由于信息的流向是单向的，打分信息无法反馈回来去提取有用的特征。这种方式下，为了提升性能，通常依赖人工提取特征。紧耦合方式，两种方法相互影响，一方面，打分信息指导特征的提取，另一方面，提取出来的特征进一步促进CF的预测能力（例如，稀疏打分矩阵的矩阵因式分解）。两方面的相互影响，使得紧耦合方式可以从辅助信息中自动学习特征，并且能平衡打分信息和辅助信息的影响。这也是紧耦合方法比松耦合方法表现更好的原因。

论文讲述了一种多层贝叶斯模型（hierarchical Bayesian model）叫协同深度学习（CDL）。实际上CDL就是把PMF模型和深度学习模型SDAE集合起来，形成一个多层贝叶斯模型。作者用贝叶斯法则表征栈式自编码器（sdae），用深度学习的方式表示content information和rating matrix，使两者双向相互影响。

其实后来除了很多变体但是model的基本结构是没有变化的，详情可参考

本文模型

图模型

这里 $x_0$ 表示item的评论信息输入矩阵，是加噪后的，而 $x_c$ 是未加噪的， $W^+$ 是 $W$ 和 $b$ 表示权重和偏执, $x_{L/2}$ 代表SDAE的latence space，文章中提到 $x_{L/2}$ 为 $r a t i n g$ 和 $c o n t e n t$ 提供一个桥梁作用，同时潜在高斯偏移量 $\epsilon$ 使得CDL能够同时学习有效特征表示并捕获item和 user的相似性。

左边的贝叶斯图的目的是通过内容生成 $V$ 矩阵，用户信息生成 $U$ 矩阵，然后通过 $v$ 和 $u$ 生成user-item的关联打分矩阵 $R$ 。这其实就是传统的PMF的推荐方法，只是这里，内容通过sdae自动提取特征，这些特征作用于v矩阵。

过程

总的过程来说，其实也包含最小二程优化的思想，固定 $V$ 更新 $U$ ,固定 $U$ 然后更新 $V$ .，而这里的 $V$ 又同时受文本和评分矩阵约束。

这里输入为 $c o r r u p t e d i n p u t$ 带噪音的文本，用 $S D A E$ 生成的 $V$ 其实不仅受评分矩阵 $r a t i n g$ 的约束，同时也受 $c l e a n i n p u t$ 的约束,用 $V$ ，这样可以完美的吧文本信息和评分矩阵相结合，文本信息解决了评分矩阵的稀疏，而评分矩阵可以为用户更好的推荐，这样的 $V$ 更能准确的表征item的信息。

公式

主要公式参考文章第三部分或者参考博文

在这里插入图片描述
这里的目标函数为上图所示：

红色框内容为：user latent vectors, weights, and biases的正则化
黄色框内容为：文本内容表征生成的vector与 item latent vectors 的高斯偏移量的2范
绿色框内容为：clean input 与SDAE输出层之间的高斯偏移量的2范
蓝色框内容为：从层l-1的输出产生具有高斯偏移量的1层输入
紫色框内容为：测量预测率的误差

更新规则参考原文

评价指标

在这里插入图片描述
参数的设置用的网格法

代码

待更新！！！

参考资料

狄拉克 $\sigma$ 函数
 作者主页
 CDL
AutoEncoder

Kai_TJU

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
推荐系统学习（五）

CDL-2015年KDD概述本文模型图模型过程公式评价指标代码参考资料Collaborative Deep Learningfor Recommender Systems概述       这一篇论文出自香港理工大学王灏博士，论文讲了一种紧耦合的混合式推荐算法。主要是栈式自编码器SDAE通过贝叶斯图方式结合。其实这篇论文和在推荐系统学习（四）中提到的协...
复制链接

扫一扫