【机器学习笔记】推荐系统

本文介绍了推荐系统的概念,详细讲解了基于内容的推荐算法,包括用户评分预测和协同过滤方法,探讨了协同过滤的向量化实现——低秩矩阵分解,并讨论了如何找到电影的相关性和均值归一化在推荐系统中的作用。
摘要由CSDN通过智能技术生成

推荐系统

一、什么是推荐系统

学习用户的轨迹,然后推荐用户尚未用过的,但是可能喜欢的东西。

二、基于内容的推荐算法

对于一个电影网站,有若干用户对几部电影的评分,现在想要预测用户对没看过电影的评分。
那么基于内容的推荐算法,意思就是我们现在已经知道电影的特征向量,然后用来拟合用户的喜爱曲线,来预测用户评分。
在这里插入图片描述
参数:
r ( i , j ) = 1 r(i,j)=1 r(i,j)=1,表示用户 i i i评价过电影 j j j
y ( i , j ) y^{(i,j)} y(i,j),表示用户 i i i给电影 j j j的评分
Θ ( j ) \Theta^{(j)} Θ(j),表示用户 j 的向量(其中向量的分量就表示了用户对电影特征的喜欢程度)
x ( i ) x^{(i)} x(i),表示电影 i 的特征。
那么对于用户 j ,电影 i ,预测该用户对电影的评分为 ( Θ ( j ) ) T ( x ( i ) ) (\Theta^{(j)})^T(x^{(i)}) (Θ(j))T(x(i)),也就是内积。

例如电影有两个特征:动作成分、爱情成分,则视n=2。因此 x ( i ) x^{(i)} x(i)可以是[1, 0.99, 0]^T,第一个是偏置项。然后对于用户 j 的评分习惯来学习出参数 Θ ( j ) \Theta^{(j)} Θ(j)=[0, 5, 0]^T,这说明用户对动作特征喜爱程度高达5,而对爱情特征喜爱程度为0。所以两个向量内积得到的分数5*0.99=4.95,就表示对电影的预测评分(因为该电影动作成分很高,因此预测用户很喜欢)。

m ( j ) m^{(j)} m(j)表示用户 j 评分过的电影数量。
因此为了学习到 Θ ( j ) \Theta^{(j)} Θ(j),求一个参数使得这个loss最小(类似于线性回归&#

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值