11-机器学习之推荐系统

最新推荐文章于 2024-03-01 00:19:16 发布

MYVision_ MY视界

最新推荐文章于 2024-03-01 00:19:16 发布

阅读量470

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengshengwei3/article/details/100263017

版权

机器学习专栏收录该内容

12 篇文章 1 订阅

订阅专栏

目录

一预测电影评分

二基于内容的推荐

三如何学习参数

四协同过滤

2.协同过滤算法

四协同过滤的向量化实现

五如何找到跟某个电影相似的电影

六均值规范化

一预测电影评分

现在一共有五部电影，并且有四个观众的评分数据，评分从一星到五星，观众有可能并没看该电影，也就是未评分。

给出如下定义

n_u=用户的数量
n_m=电影的数量
如果用户j对电影i进行了评分，r(i,j)=1
y(i,j)=1用户j对电影i的评分（只有r(i,j)=1时才有效）。

通过学习，得到用户对某些未曾评分的电影的预测评分，并进行电影推荐。

二基于内容的推荐

1.对于上述示例，建立两个特征 (x1,x2)->（romance,action),并对不同的电影给出特征值

2.对于每一个用户j，学习一个参数 $\theta ^{(j)}$ ，预测用户j 对低i部电影的评分为 $(\theta ^{(j)})^{T} x^{(i)}$ 个星。

具体公式化如下所示

三如何学习参数 $\theta ^{(j)}$

一句话总结，确定优化目标，用梯度下降法进行优化（给出学习率）

四协同过滤

1.背景介绍

根据上述例子，假设我们不知道每部电影的的”浪漫程度“和”动作程度“的具体值，可以通过用户的评价来进行预测，但是如果用户没有给出评价怎么办？也可以对每个用户都询问其偏好，然后得到这个用户的参数 $\theta ^{(j)}$ ，然后根据下述计算，得到每部电影的特征值

总结：所以我们可以通过每部电影的特征值，计算出用户对电影的评分，也可以根据用户的偏好，计算出电影的特征向量

如何同时计算上述两种参数？引入协同过滤算法

2.协同过滤算法

将上述两个代价函数加起来，得到如下代价函数

其计算过程如下

1.初始化特征值和参数值以非常小的随机值

2.用梯度下降法最小化上述代价函数

3.使用一个用户的偏好参数θ和电影的特征系数x来预测该用户未评价过的电影的评星θ_Tx。

四协同过滤的向量化实现

首先给出数据集如下

计算目标为得到下图右侧的矩阵（每个元素对应用户对电影的评分）

然后将每个电影的评分做为矩阵X ，将每个用户的参数作为 $\Theta$ ,则 $P = X\Theta ^{T}$ 可以计算出P中的每一个元素

以上过程也叫低秩矩阵分解

五如何找到跟某个电影相似的电影

计算两个电影的特征向量的模即可

六均值规范化

之前的例子中，所有的用户都至少有一个偏好设置（比如喜欢动作电影，参数里面会有体现），但是对于一个新用户，没有任何偏好设置，也没有任何评分的时候，该如何去处理？

如果在这种情况下进行预测，系统会认为新用户对所有电影的评分都是0，显然这样是不对的。

因此引入了均值规范化来解决上述问题

1.首先计算平均值，然后将Y矩阵减去平均值得到新的Y矩阵（使得Y矩阵中每行的求和结果都是0）

2.用户j 对电影i的评分预测为：

因为前面减去了均值，所以需要再加回来

3.对于新用户，假设参数为[0,0],则按上面的公式计算,从而的到预测值

MYVision_ MY视界

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
11-机器学习之推荐系统

目录一预测电影评分二基于内容的推荐三如何学习参数四协同过滤1.背景介绍2.协同过滤算法四协同过滤的向量化实现五如何找到跟某个电影相似的电影六均值规范化一预测电影评分现在一共有五部电影，并且有四个观众的评分数据，评分从一星到五星，观众有可能并没看该电影，也就是未评分。给出如下定义n_u=用户的数量 n_m=电影的数量...
复制链接

扫一扫

专栏目录

MYVision_ MY视界 CSDN认证博客专家 CSDN认证企业博客

码龄14年

146: 原创

9496: 周排名

1万+: 总排名

27万+: 访问

: 等级

2916: 积分

5386: 粉丝

220: 获赞

58: 评论

821: 收藏

私信

关注

热门文章

分类专栏

CMake 3篇
Linux 14篇
工程实践 15篇
Pytorch 5篇
tensorflow 7篇
OpenCV 8篇
深度学习 15篇
数字图像处理 24篇
各种编程 13篇
显微镜 2篇
Conan 4篇
Python 2篇
IMAGE FORMATS 12篇
机器视觉 3篇
前端开发 1篇
机器学习 12篇
未来 2篇
Eigen 4篇
语义分割 10篇

最新评论

【TIFF】八.价值五千元的TIFF存储代码，你确定不来看看？
迎着阳光～: 您好，这个存储的tiff文件为什么我用window照片打不开，是我存储再哪里有问题吗？能看看您怎么写的吗
fopen 参数'rb' 与'rb+'引发的黑色血案
Hasson Wong: 用fread( buf, 1，size, file )
【TIFF】八.价值五千元的TIFF存储代码，你确定不来看看？
zym_123456: 代码好像有几个问题。 1、拼接的图像放大成4096*4096会不会失真？ 2、拼接的三列之间好像有一个明显的竖线？ 3、生成的TIFF文件只有一个图像文件目录（Image File Directory），金字塔图像只有一个Level层。 //第二行 tiff.SaveImage(mats[3], 0, nHeight, nWidth, nHeight*2); tiff.SaveImage(mats[4], nWidth, nHeight, nWidth * 2, nHeight * 2); tiff.SaveImage(mats[5], nWidth * 2, nHeight, nWidth * 3, nHeight * 3); 最后一个SaveImage调用，nHeight * 3是不是应该为nHeight * 2？ CTileTiff::SaveImage方法里面的 cv::Mat resized; ResizeImg(roi.data, resized.data, m_nTileWidth * nScale, m_nTileHeight * nScale, 3, nPitch, m_nTileWidth, m_nTileHeight, 3, m_nTileWidth*3); 无法生成缩放图像，resized.data为NULL。
fopen 参数'rb' 与'rb+'引发的黑色血案
weixin_47301450: 大佬发现具体原因了吗23年也遇到了
10.形态学图像处理
wink.338: 为什么要反转结构元

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。