时空数据挖掘-推荐算法绪论

最新推荐文章于 2025-02-21 01:45:09 发布

SShirleyy

最新推荐文章于 2025-02-21 01:45:09 发布

阅读量577

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SShirleyy/article/details/117321051

版权

机器学习专栏收录该内容

7 篇文章

订阅专栏

本文介绍了推荐系统的应用，如Netflix、Amazon的推荐，以及面临的容量、冷启动和数据不平衡问题。传统方法包括协同过滤和内容推荐，而新方法涉及排序学习、内容感知推荐和深度学习。同时，提到了混合方法、NextPOI推荐系统，以及如何利用多源数据融合和序列挖掘提升推荐精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

@[TOC]推荐系统

1.常用的推荐系统

Netflix：电影推荐
Amazon/Alibaba：相关产品推荐
Google：网页排序（基于连接、每月排序、打分制）
Facebook：社交推荐
Yahoo：新闻内容推荐

2.难点

容量问题：百万级别的物品和亿级的用户
冷启动问题：当因为更改用户群、行为清单而造成无可借鉴的历史数据的问题
不平衡的数据集：用户的活动和物品评论采取幂级分布(power law distributed).

幂级分布又称为长尾分布
著名的二八法则：世界上百分之八十的财富被世界上百分之二十的人掌握。绝大多数的个体的尺度很小，而只有少数个体的初度相当大。如英语单词的使用频率，也可以采用这个规律学习少数的单词快速学会英语使用方式也称为最小努力原则。而用户对物品和评论的频率也采用这种分布。造成数据集的不平衡

3.常用的方法

3.1传统的方法

优点

直观
不需要持续训练
易于解释
易于处理新的用户和物品
准确率高、可扩展性强

3.1.1协调过滤(Collaborative Filtering)

在这里插入图片描述
基本思想

针对人与物体的交互进行分析，小人A与小人C交互的物品相似，则可以推荐C的交互物品给A

3.1.2内容推荐(Content-based Recommendations)

在这里插入图片描述

基本思想

对物品的信息内容分析，不针对交互行为分析
利用机器学习的方式，针对用户选择物品的特征描述符训练一个用户偏好的模型
推荐和用户之前选择相似的物品推荐给用户

优点

不需要别用户的数据/没有冷启动问题
推荐新的、不受欢迎的物品
对推荐的物品做出说明
利于解释
准确性强、可扩展

缺点

需要有意义的特征
一些物体很难提取特征
容易过拟合
用户的品味必须通过这些特征能让能表示为一个可被学习的函数
很难平滑的补充

3.2新的方法

3.2.1排序学习(Learning to Rank)

基本思路

通过训练的数据集构建一个排序模型
训练数据可以是偏序或者二元判断（相关/不相关）
标准的监督分类学习
1、逐点排序
·根据个体相关判断排序最小化损失函数
·基于回归或者排名分数
·排名分数可以通过回归分类、部分分类、逻辑回归、SVM、GBDT决定
2、两两排序
·通过两两偏好来定义损失函数
·由SVM, RankBoost, RankNet, Frank排序
3、列表排序

3.2.2内容感知推荐(Content-aware Recommendations)

Tensor Factorization
Factorization Machines

3.2.3深度学习(Deep Learning)

在这里插入图片描述

3.2.4相似度(Similarity)

形似可以指多种维度、包括用户行为、标签等，将这些维度形成的模型综合构造一个大型的模型

3.2.5信任网络推荐(Social Recommendations)

通过信任分权为用户，可以通过协同过滤、排序等筛选信任
也可以与其他方法结合

3.3混合方法

4.Next POI（point of interst）

为用户推荐符合用户喜好的未来可能会访问的POI

4.1基于矩阵分解的模型

学习用户的POI喜好，按照偏好程度推荐POI，并不考虑用户实时需求。
在这里插入图片描述

4.2多源数据融合

多源数据融合是通过多种方面来刻画用户的喜好，提高推荐的精确度。包括地理位置】类型数据】文本数据、访问时间、社交网络数据等综合考虑。

4.3基于序列挖掘的模型

用户的访问序列对下一个POI可能产生影响。
马尔科夫模型
POI转移概率模型
深度学习模型
CNN, RNN，NLP 等序列模型，直接学习每一个POI在下一个时间点会被访问的概率

博客等级

码龄7年

19
原创

32
点赞

69
收藏

15
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

OmniAnomaly运行代码踩坑笔记(cuda与代码要求的tensorflow代码不匹配)
名字叫啥好: 请问您的gpu显存是多少呀？我在复现过程中出现报错：InternalError (see above for traceback): Blas GEMM launch failed : a.shape=(100, 500), b.shape=(500, 500), m=100, n=500, k=500 24G的gpu显存都占满了，不知道您有出现过这个问题嘛？
OmniAnomaly运行代码踩坑笔记(cuda与代码要求的tensorflow代码不匹配)
weixin_44206180: 请问，你有遇到过训练过程中loss太大，出现奔溃的过程吗
fliqlo安装感叹号无法显示时间
歪你挡着我发光了: 牛X,一针见血
fliqlo安装感叹号无法显示时间
一次就好wubaq: 欸黑，解决了，大神！所以说这个东西必须要TLS 1.2协议吗
deelp(pro) 获得免费额度以及API密钥的办法
CSDN-Ada助手: 恭喜您写出了第17篇博客！标题“deelp(pro) 获得免费额度以及API密钥的办法”听起来非常吸引人。您的博客内容一直都很有见地，能够帮助读者解决实际问题。在这个博客中，您提到了获得免费额度和API密钥的方法，这无疑为我们这些想要使用deelp(pro)的人提供了很大的帮助。我期待着您下一篇博客的发布，希望您能继续分享关于deelp(pro)以及其他相关主题的知识。或许在下一篇博客中，您可以分享一些实际案例，说明如何在使用deelp(pro)的过程中充分发挥其优势。再次恭喜您，并期待您的下一篇博客！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。