推荐系统—影视评分预测

最新推荐文章于 2024-07-25 16:05:31 发布

LiFeitengup

最新推荐文章于 2024-07-25 16:05:31 发布

阅读量1w

点赞数 2

分类专栏：机器学习推荐系统文章标签：推荐系统线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LiFeitengup/article/details/9174419

版权

机器学习同时被 2 个专栏收录

35 篇文章 2 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

本文根据Andrew Ng的Machine Learning的课写就。

=======================================一、预测电影评分==========================================

全文以“预测电影评分”例子展开

r(i,j)=0则表明user_j没有对movie_i 没有评分，

推荐系统要做的就是通过预测user_j对这些movie {i|r(i,j)=0}的评分来给user_j 推荐其可能会喜欢的电影<预测评分较高的movie>

=======================================二、基于内容的推荐=======================================

对每个movie_i引入特征x(i)=(x1, x2)，这种特征可能表明user对movie类型的偏好：浪漫or动作等

对于每个user引入一个参数theta，然后对评分矩阵的每列(对应一个user)做线性回归，数据是{ (x(i), y(i,j)) |r(i,j)=1，for some j all i}

像机器学习一样，x(i)添加个1变量x(i)=(1, x1, x2)

那么对于未评分的movie_t，我们可以使用线性回归训练的参数theta与对应特征x(t)做内积来得到其预测评分

对每个用户都训练一个参数theta_j，优化模型如下：

优化算法：注意正则项是不约束x(i)=(1, x1, x2)中1对应的参数theta的第一项theta0，所以k=0与k=1,2分别对待

=======================================三、协同过滤=======================================

现在换个角度：如果知道theta for all user j，如何来预测x(i) = (x1, x2) all i

仍然可以使用线性回归，为训练每个x(i)，需要评分矩阵的第i行数据{ (x(i), y(i,j)) |r(i,j)=1，for some i all j}

theta_j = (0, theta1, theta2) ；theta1=5说明user_j喜欢romance类movie， theta2=5说明user_j喜欢action类movie，只能有一个等于5哦，

我觉得也可以是：theta_j = (0, 4, 1) ；喜欢romance 4 action 1.

对应的优化：

协同过滤：交替优化theta与x

=========================================四、协同过滤算法=======================================

优化：

优化：注意去掉了theta和x的添加项

=========================================五、实现细节补充=======================================

实现细节：

如果有user没有对任何电影评分或者所有评分的电影都是0分，那么所学习到的参数是零向量，

则预测都是0值，这是不合理的。通过将评分矩阵减去其行均值再进行线性回归来“避免”这种情况

=========================================六、一点思考==========================================

协同过滤那块，同时优化theta、x，这样得到的theta、x还有特定的意义<比如：x是否还表征对影视类型的喜爱与否>没有？
回归中，在x数据上不添加1-feature是不是因为后来引入的平均值化；如果不是，那会对结果有什么影响？
用x-feature来表征一个movie，x-feature的各分量的可解释性；应该会有一部分user应为演员的缘故有一些"偏爱"。
这里，讲的"基于内容的推荐"与"协同过滤"跟以前对这两个词的认识/所指内容不同，查清楚、搞明白。

这周还会再更一篇关于此节课的算法实现，会对上述部分问题做出回答。

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。