【吴恩达机器学习笔记】十四、推荐系统_吴恩达推荐系统(1)

2401_84181731

于 2024-04-30 10:26:00 发布

阅读量412

点赞数 25

分类专栏：程序员文章标签：机器学习笔记人工智能

本文链接：https://blog.csdn.net/2401_84181731/article/details/138337553

版权

程序员专栏收录该内容

153 篇文章 0 订阅

订阅专栏

2. 基于内容的推荐算法

现在，我们来介绍一种算法，叫做基于内容的推荐算法，下面是一个例子。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5YP1086Z-1670375250026)(吴恩达机器学习.assets/image-20211119190234621.png)]

例子还是和上节课的一样，现在我们引出两个特征分别代表爱情和动作的程度，然后再加入一个截止特征，将他们组合成一个x(i)向量代表每一部电影的特征量，而每个用户都会对应一个θ，这如何得到我们后面会讲，总之如果想预测用户对于某部电影的评分的话，可以看做是一次线性问题，只需将x于θ的转置相乘做一次内积便能得到最终结果。接下来，我们来看看其中的具体步骤。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xIkop78E-1670375250028)(吴恩达机器学习.assets/image-20211119191159648.png)]

这里要注意的是m(j)代表评价一部电影的用户数量，而我们可以通过上面的值得到代价函数，我们来整合一下。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VFo52k5x-1670375250030)(吴恩达机器学习.assets/image-20211119191417692.png)]

我们可以将单个θ的代价函数再通过累加变成多个参数合成的代价函数，接下来再来做一个总结。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-du49QRkr-1670375250032)(吴恩达机器学习.assets/image-20211119191831379.png)]

上面还提到了如何拟合θ参数，这里与线性回归问题十分相似，因为这个算法本质上也是线性回归。

3. 协同过滤

这节课再来讲一个关于如何构建推荐系统的算法，叫做协同过滤，它可以自动学习所需要的特征，通俗来讲就是这个算法通过观察用户的行为来得到特征，所以这里的协同有每个用户都在帮助这个算法进行学习的意思。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yeRpK375-1670375250034)(吴恩达机器学习.assets/image-20211119192446992.png)]

还是来看同一个例子，只不过这里我们不知道特征是什么，但是我们可以通过询问用户对爱情电影和动作电影的喜爱程度即θ来推断出x是什么，如下面所示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lpSKJKpB-1670375250036)(吴恩达机器学习.assets/image-20211119192834705.png)]

我们可以通过给定的θ，从而最小化上面的代价函数得知x是什么。你现在可能会将这节课的内容和上节课的内容混淆，所以我们现在这里总结一下。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5BTASJcP-1670375250044)(吴恩达机器学习.assets/image-20211119193246791.png)]

上节课我们是通过给定x得到θ，而这节课我们是通过给定θ得到x，其实这两者并不冲突，我们可以通过反复进行这两个算法，从θ得到x再从x得到θ这样反复进行，我们最终会得到一个非常适合的特征和θ值。

然而这样做的效率并不高，如果能够同时得到θ和x就再好不过了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vWV85wTD-1670375250049)(吴恩达机器学习.assets/image-20211119194611961.png)]

我们把上面用到的两个式子结合起来，就得到了最终的代价函数。我们上面的第一个代价函数前面其实就是对第j个用户的所有评分过的电影求和，而第二个代价函数前面其实就是对第i个电影被所有评分过它的用户求和，而将这两者结合起来就能得到最终的代价函数，可以同时得到x和θ值。所以，总结起来如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-frx0ZO9F-1670375250050)(吴恩达机器学习.assets/image-20211119195209186.png)]

我们首先对于x和θ初始化为小的随机值。
然后最小化代价函数，可以利用梯度下降算法或其它高级算法，得到x和θ值。
最后通过得到的x和θ去预测用户对于电影的评分，即将θ得转置与x做内积。

4. 矢量化：低秩矩阵分解

我们接下来要解决的问题是，如果给定一个商品，我们能否够通过这个商品去联想到其它相关的商品，所以我们希望可以通过另一种方法来写出协同过滤算法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4ECYyPqA-1670375250053)(吴恩达机器学习.assets/image-20211119200435022.png)]

还是同一个例子，只不过现在我们将所有的评分y提取出来变成一个矩阵Y来表示，然后按下面展开。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-H4meGGg6-1670375250055)(吴恩达机器学习.assets/image-20211119200526174.png)]

我们可以将矩阵中展开的值进行进一步提取，提取出X和θ两个向量，这样就可以通过XθT来表示Y了，这里的协同过滤我们还可以称为低秩矩阵分解（low rank matrix factorization）。

所以，我们就可以利用每个电影所学习到的特征，来寻找相似的电影。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6q8mL2Ih-1670375250056)(吴恩达机器学习.assets/image-20211119201312560.png)]

我们可以计算电影j的x和电影i的x的差值，从而判断两者的相似度。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新**

需要这份系统化资料的朋友，可以戳这里获取

2401_84181731

关注

25
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
【吴恩达机器学习笔记】十四、推荐系统_吴恩达推荐系统(1)

例子还是和上节课的一样，现在我们引出两个特征分别代表爱情和动作的程度，然后再加入一个截止特征，将他们组合成一个x(i)向量代表每一部电影的特征量，而每个用户都会对应一个θ，这如何得到我们后面会讲，总之如果想预测用户对于某部电影的评分的话，可以看做是一次线性问题，只需将x于θ的转置相乘做一次内积便能得到最终结果。上节课我们是通过给定x得到θ，而这节课我们是通过给定θ得到x，其实这两者并不冲突，我们可以通过反复进行这两个算法，从θ得到x再从x得到θ这样反复进行，我们最终会得到一个非常适合的特征和θ值。
复制链接

扫一扫