Machine Learning第九讲【推荐系统】-- (三)低秩矩阵分解

一、Vectorization: Low Rank Matric Factorization(向量化: 低秩矩阵分解)

我们仍然使用之前movie的例子:

将这些数据写成矩阵的形式,即右边的Y矩阵,又因为用户j对电影i的评分预测值为:

因此Y矩阵对应的预测值应为:

                                              


我们记:

                                            

则:

 

                                        

                                            = 

上述就是协同矩阵的向量化。

那么我们应该怎样来找出相关商品呢?

首先对于每一个产品i,我们找出其特征向量

找出使两个商品特征比较相同的产品,即可以找出使得最小的五个商品,则这5个商品就是和i最相似的5个商品,既可以作为相关产品推荐。

 

二、Implementational Detail: Mean Normalization(实现细节: 均值归一化)

假设我们有下面一组数据:

 

即对于某一部电影,利用已经评过分的值(?不计算在内),计算出平均分,记为μ,于是归一化矩阵为原来的Y的每一个数减去这一行(这一部电影)对应的平均值,得到新的Y,如图片右侧所示(?的仍为?),利用这个新的Y矩阵学习θ和x的值。则对于Eve,之前关于最小化的分析仍成立,即

归一化之后的预测值公式为:

因此对于Eve的预测值为:

其实对于这个预测结果我们是可以接受的,因为我们不知道Eve的喜好,因此把她的评分预测为平均水平。

特殊情况:若出现有一部电影无评分的情况,则可以考虑使每列的均值为0,即计算每列的均值,用Y减去对应列的均值得到新的Y矩阵。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值