机器学习9.5：推荐系统

最新推荐文章于 2024-08-14 11:49:59 发布

国易

最新推荐文章于 2024-08-14 11:49:59 发布

阅读量191

点赞数

分类专栏：王恩达机器学习入门

本文链接：https://blog.csdn.net/wycgi/article/details/84972322

版权

王恩达机器学习入门专栏收录该内容

14 篇文章 1 订阅

订阅专栏

参数

$n_u$ 表示用户数量
$n_m$ 表示电影数量
$r (i, j)$ 表示用户j是否有评价电影i，若是，则值为1
$y (i, j)$ 表示用户j对电影i的评分

基于内容的推荐

$\theta^{(j)}$ 表示第j个用户的模型参数
$x^{(i)}$ 表示第i个电影的输入特征
对于用户j来说，预测其对电影i的评分： $(\theta^{(j)})(x^{(i)})$
$m^{(j)}$ 表示被用户j评分的电影的数量

其中， $x^{(i)}$ 中可以包括特征动作、爱情、喜剧等，先指定每部电影的特征，比如电影A动作0.9，爱情0.7，喜剧0.1。

用线性回归计算模型参数 $\theta^{(j)}$ ，其目标函数(去掉线性回归的目标函数中除以m的项)：
在这里插入图片描述

同时计算各用户的模型参数 $\theta^{(1)}，\theta^{(2)}，\dots，\theta^{(n_u)}$ ，其目标函数：
在这里插入图片描述

梯度下降算法：
在这里插入图片描述

基于用户的推荐

先指定模型参数 $\theta^{(j)}$ ，再计算电影的特征

用线性回归计算电影i的特征 $x^{(i)}$ ，其目标函数：
在这里插入图片描述

同时计算各电影的特征 $x^{(1)}，x^{(2)}，\dots，x^{(n_u)}$ ，其目标函数：
在这里插入图片描述

梯度下降：

$x^{(i)}_j:=x^{(i)}_j-\alpha(\sum_{j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})\theta^{(i)}_k) \quad k=0\\ x^{(i)}_j:=x^{(i)}_j-\alpha( \sum_{j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})\theta^{(i)}_k+\lambda x^{(i)}_j) \quad k\not=0$

协同过滤算法

随机初始化模型参数 $\theta^{(j)}$ 和 $x^{(i)}$ 为 $(-\epsilon,\epsilon)$ ，注意要像神经网络算法一样，破坏对称性，否则会得到相同的值

PS：这里不用设置 $\theta^{(j)}_0$ 和 $x^{(i)}_0$ ，因为如果需要这两个参数，该算法会自己学习得到。

结合基于内容推荐和基于用户推荐两种算法，目标函数如下：
在这里插入图片描述

梯度下降：
在这里插入图片描述

得到各参数后，根据电影的输入特征，和用户的模型参数，预测用户评分 $\theta^Tx$

低秩矩阵分解

左图是实际评分，右图是预测评分
在这里插入图片描述

其中，预测评分的矩阵可以分解为 $X\Theta^T$ ：
$\begin{bmatrix} (x^{(1)})^T \\ (x^{(2)})^T\\ \vdots\\ (x^{(n_m)})^T \end{bmatrix} \quad \Theta = \begin{bmatrix} (\theta^{(1)})^T \\ (\theta^{(2)})^T\\ \vdots\\ (\theta^{(n_u)})^T \end{bmatrix}$