推荐系统 recommender system

最新推荐文章于 2024-01-26 15:20:14 发布

木杉Vincent

最新推荐文章于 2024-01-26 15:20:14 发布

阅读量1k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习协同过滤

本文链接：https://blog.csdn.net/neverever01/article/details/85174746

机器学习专栏收录该内容

9 篇文章

订阅专栏

本文深入探讨了协同过滤推荐系统的原理及应用。通过数学模型详细解释了如何通过用户历史评分预测其对未接触商品的喜好程度，利用特征向量和喜好程度矩阵优化推荐精度。适用于电商、影视等领域个性化推荐。

使用场景

消费者 $C={user1,user2,user3,…,usernu}C=\{user_1,user_2,user_3,\dots,user_{n_u}\}$ ,一共有 $n_u$ 个样本

商品 $G={prod1,prod2,…,prodnp}G=\{prod_1,prod_2,\dots,prod_{n_p}\}$ ,一共有 $n_p$ 个样本

消费者对商品的评分如下表：

	$user_1$	$user_2$	$user_3$	$…\dots$	$user_{n_u}$
$prod_1$	$r_{1,1}$	$r_{1,2}$	$r_{1,3}$	$…\dots$	$r_{1,n_u}$
$prod_2$	$r_{2,1}$	$r_{2,2}$	$r_{2,3}$	$…\dots$	$r_{2,n_u}$
$…\dots$
$prod_{n_p}$	$r_{n_p,1}$	$r_{n_p,2}$	$r_{n_p,3}$	$…\dots$	$r_{n_p,n_u}$

描述商品i在某特征的符合程度 $xi=[f1,f2,…,fm]T(m×1)x_i=[f_1,f_2,\dots,f_m]^T \quad(m \times 1)$
消费者j对某个特征的喜好程度 $θj=[θ1,θ2,…,θm]T(m×1)\theta_j=[\theta_1,\theta_2,\dots,\theta_m]^T \quad (m\times 1)$

特征的维数m将会在后面说到。

对于某个商品i，消费者j对其评分 $r_{i,j}$ 由 $xi,θjx_i,\theta_j$ 来决定，即
$r_{i,j}=\theta_j^Tx_i$

协同过滤算法

协同过滤算法的思想是对某种特征的喜好相同(比如都喜欢动作电影)的消费者，对在某种特征上比较契合的商品上评价也应趋于一致(对于新出的动作电影评分都可能较高)

设置 $m$ 个特征， $f1,f2,…,fmf_1,f_2,\dots,f_m$ ,比如电影的浪漫程度，暴力程度，喜剧程度等等，这些特征不用手工提取，只需要确定m的大小，特征的具体值将会由算法学习得出。
对于 $n_u$ 个消费者， $n_p$ 个商品，我们先初始化两个数据集：

$X={x1,x2,…,xnp}X=\{x_1,x_2,\dots,x_{n_p}\}$

$Θ={θ1,θ2,…,θnu}\Theta=\{\theta_1,\theta_2,\dots,\theta_{n_u}\}$

随机赋一些较小的值。

协同过滤算法的基本思路是：同时优化 $X,ΘX,\Theta$ ，优化目标如下：

$J(x_1,\dots,x_{n_p},\theta_1,\dots,\theta_{n_u})=\frac{1}{2}\sum_{(i,j):r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2+\frac{\lambda}{2}\sum_{i=1}^{n_p}\sum_{k=1}^{m}(x_i^{k})^2 +\sum_{j=1}^{n_u}\sum_{k=1}^m(\theta_j^k)^2$
注意，这时候就不需要加上恒为1的偏差（如之前的 $x0=1,θ0=1x_0=1,\theta_0=1$ )，这时 $\in \mathbb{R}^m,\theta \in \mathbb{R}^m$

使用梯度下降等方法进行优化，对 $i=1,2,…,np;j=1,2,…,nu;k=1,2,…,mi=1,2,\dots,n_p;j=1,2,\dots,n_u;k=1,2,\dots,m$ ：
$x_i^k=x_i^k-\alpha(\sum_{j:r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2 +\lambda_i^k)\\ \theta_j^k=\theta_j^k-\alpha(\sum_{i:r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2 +\lambda_i^k)$