从零开始构建推荐引擎综合指南

最新推荐文章于 2023-09-16 01:45:27 发布

AmorFatiall

最新推荐文章于 2023-09-16 01:45:27 发布

阅读量309

点赞数 1

分类专栏：个人学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43561290/article/details/100667345

版权

本文详细介绍了从零开始构建推荐引擎的过程，包括数据收集（显式和隐式）、数据存储的选择，以及数据过滤的两种主要方法：基于内容的过滤和协同过滤。在过滤部分，解释了如何计算余弦相似度和使用欧几里得距离/皮尔逊相关性，并讨论了协同过滤在用户与用户间和商品间的应用，以及冷启动问题的解决方案。

摘要由CSDN通过智能技术生成

1 数据收集

收集数据是构建推荐引擎的第一步也是最关键的一步。可以通过两种方式收集数据：显式和隐式。显示数据是用户有意提供的信息，比如电影排名，相反隐氏数据则不是用户主动提供，而是从数据流中收集得到的信息，例如搜索历史、点击率、历史订单等。

2 数据存储

数据量决定了模型的建议有多好，例如，在电影推荐系统中，用户对电影的评价越多，推荐给其他用户的效果就越好。数据类型对采用何种存储类型有很重要的影响，这种类型的存储可以包括一个标准的SQL数据库、NoSQL数据库或某种类型的对象存储。

3 数据过滤

在收集和存储数据之后，我们必须对其进行过滤，以便提取出最终推荐所需的相关信息。

3.1 基于内容的过滤

推荐的产品类似于用户过去喜欢的产品。
基于内容的过滤算法找到了轮廓向量与项目向量夹角的余弦，也就是余弦相似度。
以Netflix为例：它们以向量形式保存与每个用户相关的所有信息。这个向量包含用户过去的行为，也就是用户喜欢/不喜欢的电影和他们给出的评分，这个向量也被称为轮廓向量（profile vector）。所有与电影相关的信息都存储在另一个叫做项目向量（item vector）中。项目向量包含每个电影的细节，如类型、演员、导演等。
欧几里得距离/皮尔逊相关性计算相关性
这种搭建推荐引擎的方法泛化性能很差。不能推荐新的产品给用户，例如用户历史数据显示喜欢动作片，那么推荐就会一直推荐动作片而不会推荐纪录片、爱情片等等。

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
从零开始构建推荐引擎综合指南

1 数据收集收集数据是构建推荐引擎的第一步也是最关键的一步。可以通过两种方式收集数据：显式和隐式。显示数据是用户有意提供的信息，比如电影排名，相反隐氏数据则不是用户主动提供，而是从数据流中收集得到的信息，例如搜索历史、点击率、历史订单等。2 数据存储数据量决定了模型的建议有多好，例如，在电影推荐系统中，用户对电影的评价越多，推荐给其他用户的效果就越好。数据类型对采用何种存储类型有很重要的影响...
复制链接

扫一扫

专栏目录

AmorFatiall CSDN认证博客专家 CSDN认证企业博客

码龄6年

45: 原创

6万+: 周排名

137万+: 总排名

5万+: 访问

: 等级

996: 积分

108: 粉丝

23: 获赞

5: 评论

179: 收藏

私信

关注

热门文章

分类专栏

数据分析 1篇
python 13篇
机器学习 11篇
个人学习 36篇
数据集 2篇

最新评论

文本数据处理的终极指南【英文文本】
营320: 你好，我看都是对单个句子的词性标注和词形还原，如何对csv文件中的多条文本做词性标注和词形还原呢，麻烦帮忙解答一下吧（俺是个编程小白）
异常值检测——孤立森林(Isolation Forest)
天天睡: 你好，请问一下，我有1.8w个数据，有孤立森林检测时，要花3秒左右才能完成，有什么方法可以提高速度吗？
【NLP】tensorflow进行中文自然语言处理中的情感分析
菠萝啤YJB: 您好，请问是tensorflow2.0吗
Aspect Based Sentiment Analysis (ABSA)
AmberTYP: 请问有没有代码？可以共享一下吗？谢谢
ELMO模型
六七～: 你好，请问包括卷积层的完整的模型可以说下吗？数据卷积层的数据是四维的嘛？[batch_size,time_steps,max_word_length,char_length] ,然后对后面的两个维度进行卷积，输入LSTM层的维度最终回调整为[batch_size,time_steps,dim]??

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。