吴恩达机器学习笔记57-基于内容的推荐系统（Content Based Recommendations）

weixin_34087301

于 2019-03-17 03:19:00 发布

阅读量238

点赞数

文章标签：人工智能数据结构与算法

原文链接：http://www.cnblogs.com/sl0309/p/10545250.html

版权

博客以电影供应商为例，有5部电影和4个用户，部分用户有评分。希望构建算法预测用户对未看电影的评分以作推荐依据。引入相关标记，假设每部电影有浪漫和动作两个特征，采用线性回归模型，针对每个用户训练模型，给出预测评分、代价函数及梯度下降更新公式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

　　假使我们是一个电影供应商，我们有 5 部电影和 4 个用户，我们要求用户为电影打分。

　　前三部电影是爱情片，后两部则是动作片，我们可以看出Alice 和Bob 似乎更倾向与爱
情片，而 Carol 和 Dave 似乎更倾向与动作片。并且没有一个用户给所有的电影都打过分。
我们希望构建一个算法来预测他们每个人可能会给他们没看过的电影打多少分，并以此作为
推荐的依据。

下面引入一些标记：
　　?? 代表用户的数量
　　?? 代表电影的数量
　　?(?, ?) 如果用户 ? 给电影 ? 评过分则 ?(?, ?) = 1
　　?(?,?) 代表用户 ? 给电影 ? 的评分
　　??代表用户 ? 评过分的电影的总数

　　在一个基于内容的推荐系统算法中，我们假设对于我们希望推荐的东西有一些数据，这
些数据是有关这些东西的特征。假设每部电影都有两个特征，如?1代表电影的浪漫程度，?2代表电影的动作程度。

则每部电影都有一个特征向量，如?(1)是第一部电影的特征向量为[0.9，0]。

　　下面我们要基于这些特征来构建一个推荐系统算法。假设我们采用线性回归模型，我
们可以针对每一个用户都训练一个线性回归模型，如?(1)是第一个用户的模型的参数。于
是，我们有：

?(?)用户 ? 的参数向量
?(?)电影 ? 的特征向量
对于用户 ? 和电影 ?，我们预测评分为：(?(?))??(?)

代价函数：
针对用户 ?，该线性回归模型的代价为预测误差的平方和，加上正则化项：

其中 ?: ?(?, ?)表示我们只计算那些用户 ? 评过分的电影。在一般的线性回归模型中，误
差项和正则项应该都是乘以1/2?，在这里我们将?去掉。并且我们不对方差项?0进行正则
化处理。

　　上面的代价函数只是针对一个用户的，为了学习所有用户，我们将所有用户的代价函数
求和：

如果我们要用梯度下降法来求解最优解，我们计算代价函数的偏导数后得到梯度下降的
更新公式为：

转载于:https://www.cnblogs.com/sl0309/p/10545250.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。