CF协同过滤与SVD分解

最新推荐文章于 2023-12-27 18:07:29 发布

Icevivina

最新推荐文章于 2023-12-27 18:07:29 发布

阅读量783

点赞数

分类专栏：机器学习算法文章标签：推荐算法

本文链接：https://blog.csdn.net/zhouhong0284/article/details/79663630

版权

机器学习算法专栏收录该内容

19 篇文章 0 订阅

订阅专栏

协同过滤

具体可以参考这篇文章：https://www.cnblogs.com/lesleysbw/p/6024379.html
协同过滤CF分为两种：基于客户的CF和基于物品的CF。
协同过滤的三个步骤：

1.收集用户偏好

这个是生成数据矩阵的过程，最重要的有两点：降噪和归一化。降噪需要使用SVD分解来降低信息冗余；归一化是为了将不同特征的影响视为一致。

2.找到相似的用户或物品

核心是:距离的衡量标准。
关于相似度的计算，现有的几种基本方法都是基于向量（Vector）的，其实也就是计算两个向量的距离，距离越近相似度越大。在推荐的场景中，在用户 - 物品偏好的二维矩阵中，我们可以将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度，或者将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度。
一般有：欧氏距离，皮尔逊距离，cos距离等。

3.计算推荐

基于用户的 CF 的基本思想相当简单，基于用户对物品的偏好找到相邻邻居用户，然后将邻居用户喜欢的推荐给当前用户。
基于物品的 CF 的原理和基于用户的 CF 类似，只是在计算邻居时采用物品本身，而不是从用户的角度，即基于用户对物品的偏好找到相似的物品，然后根据用户的历史偏好，推荐相似的物品给他。

协同过滤与SVD

协同过滤可以利用SVD分解将原本稀疏的高维矩阵映射到低维矩阵中，降低了相似度计算的复杂度，提高了推荐系统引擎的效果。
SVD是提取信息的强大工具，利用SVD实现，我们可以用小得多的数据集来表示原始数据集。这样做，实际上是去除了噪声和冗余信息。简单版本的推荐系统能够计算项或者人之间的相似度，更先进的方法则利用SVD从数据中构建一个主题空间，然后再在该空间下计算其相似度。
如果我们将数据排列成一个矩阵，行是客户信息，列是客户对每个商品的评分，那么矩阵为

*	鳗鱼	炸鸡	寿司	烤肉	猪肉
Ed	0	0	0	2	2
Pe	0	0	0	3	3
Ae	1	1	1	0	0
Je	5	5	5	0	0

对这个矩阵做奇异值分解：
$Data=U\Sigma V^T$
**
那么可以看出U矩阵是对列进行压缩，也就是将每个客户的特征从5个变为我们想要的k个，这样我们可以将计算客户之间的相似度的计算变得简单；
V矩阵是对行进行压缩，也就是当我们计算物品之间的相似度的时候，可以将每个物品的得分从4维降为想要的k维，从而降低计算量。奇异值的含义就是主题空间的个数。

协同过滤与PCA降维

协同过滤是基于PCA降维的，主要原理都使用SVD分解得到特征空间中的主要信息，去除冗余信息，使得计算变得更加简单。

Icevivina

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CF协同过滤与SVD分解

协同过滤具体可以参考这篇文章：https://www.cnblogs.com/lesleysbw/p/6024379.html 协同过滤CF分为两种：基于客户的CF和基于物品的CF。协同过滤的三个步骤：1.收集用户偏好这个是生成数据矩阵的过程，最重要的有两点：降噪和归一化。降噪需要使用SVD分解来降低信息冗余；归一化是为了将不同特征的影响视为一致。2.找到相似的用户或...
复制链接

扫一扫