机器学习—推荐系统

最新推荐文章于 2024-07-11 17:45:00 发布

橙子啵啵

最新推荐文章于 2024-07-11 17:45:00 发布

阅读量204

点赞数

分类专栏：吴恩达机器学习课程整理文章标签：机器学习算法

本文链接：https://blog.csdn.net/Ducky_/article/details/118601725

版权

吴恩达机器学习课程整理专栏收录该内容

9 篇文章 0 订阅

订阅专栏

推荐系统

上期内容

异常检测

问题举例

假设我们有5部电影和4个用户，我们要求用户为电影打分，得到：

movie	A	B	C	D
Love at last	5	5	0	0
Romance forever	5	?	?	0
Cute puppies of love	?	4	0	?
Nonstop car chases	0	0	5	4
Swords vs. karate	0	0	5	?

可以看出，A、B两人更倾向于前三部那种爱情片，C、D两人更倾向于后两部动作片。
为了方便接下来对于算法的介绍，这里引入一些符号：
$n_u$ 代表用户数量；
$n_m$ 代表电影数量；
$r (i, j) = 1$ 时表示用户 $j$ 给电影 $i$ 评过分；
$y^{(i,j)}$ 代表用户 $j$ 给电影 $i$ 的评分；
$m_j$ 代表用户 $j$ 评过分的电影数；

基于内容的推荐系统

movie	A	B	C	D	x₁	x₂
Love at last	5	5	0	0	0.9	0
Romance forever	5	?	?	0	1.0	0.01
Cute puppies of love	?	4	0	?	0.99	0
Nonstop car chases	0	0	5	4	0.1	1.0
Swords vs. karate	0	0	5	?	0	0.9

其中， $x_1$ 、 $x_2$ 代表电影的两个特征，分别是：romance和action。

基于电影特征推荐

我们用 $\theta_j$ 表示用户 $j$ 的参数向量； $x^{(i)}$ 表示电影 $i$ 的特征向量；对于用户 $j$ 和电影 $i$ ，我们预测评分为 $(\theta^{(j)})^Tx^{(i)}$ 。针对用户 $j$ ，该线性回归模型的代价函数可以表示如下：
$min_{\theta_j}\ \frac12\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}(\theta_k^{(j)})^2$
其中， $i : r (i, j)$ 表示我们只计算用户 $j$ 评过分的电影。为了学习所有的用户，我们将所有用户的代价函数求和：
$min_{({\theta^{(1)}},...,\theta^{(n_u)})}\ \frac12\sum^{n_u}_{j=1}\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}\sum^{n_u}_{j=1}\sum^n_{k=1}(\theta_k^{(j)})^2$ 接下来用梯度下降算法求最优解：
$\theta_k^{(j)}:=\theta_k^{(j)}-\alpha\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x_k^{(i)}\ \ \ \ \ \ \ for\ k=0$ $\theta_k^{(j)}:=\theta_k^{(j)}-\alpha(\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x_k^{(i)}+\lambda\theta_k^{(j)})\ \ \ \ \ \ \ for\ k\neq0$

基于用户参数推荐

相反地，当我们拥有用户的参数时，我们可以学习得出电影的特征：
$min_{x^{(1)},...,x^{(n_m)}}\ \frac12\sum^{n_m}_{i=1}\sum_{j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}\sum^{n_m}_{i=1}\sum^n_{k=1}(x_k^{(i)})^2$

协同过滤

在搭建一个推荐系统时，如果我们既没有用户参数，也没有电影的特征时，可以通过协同过滤算法来同时学习这两者。代价函数改为：
$J(x^{(1)},...,x^{(n_m)},\theta^{(1)},...,\theta^{(n_u)})=\frac12\sum_{(r:j):r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})^2+\frac{\lambda}{2}\sum^{n_m}_{i=1}\sum^n_{k=1}(x_k^{(i)})^2+\frac{\lambda}{2}\sum^{n_u}_{j=1}\sum^n_{k=1}(\theta_k^{(j)})^2$ 对代价函数求偏导，结果如下：
$x_k^{(i)}:=x_k^{(i)}-\alpha(\sum_{j:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})\theta_k^{(j)}+\lambda x_k^{(i)})$ $\theta_k^{(j)}:=\theta_k^{(j)}-\alpha(\sum_{i:r(i,j)=1}((\theta^{(j)})^Tx^{(i)}-y^{(i,j)})x_k^{(i)}+\lambda\theta_k^{(j)})$ 协同过滤算法使用步骤如下：

初始化 $X$ 、 $\Theta$ 为一些随机小值
使用梯度下降算法最小化代价函数
训练完后，使用 $(\theta^{(j)})^Tx^{(i)}$ 为用户 $j$ 给电影 $i$ 评分

均值归一化

如果我们新增一名新用户E，并且E未曾对任何电影进行评分，那我们的推荐过程可以如下进行：

对已有用户评分结果进行均值归一化处理
系统将会认为E对电影的评分是该电影的平均分
接下来的步骤同上述推荐算法

橙子啵啵

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习—推荐系统

推荐系统往期内容1. 单变量线性回归2. 多变量线性回归3. 逻辑回归4. 正则化5. BP神经网络6. 机器学习诊断法7. 聚类和降维8. 异常检测问题举例假设我们有5部电影和4个用户，我们要求用户为电影打分，得到：movieABCDLove at last5500Romance forever5??0Cute puppies of love?40?Nonstop car chases0054Sw
复制链接

扫一扫