数据挖掘：推荐系统

最新推荐文章于 2024-08-12 20:34:30 发布

bakalaka

最新推荐文章于 2024-08-12 20:34:30 发布

阅读量3.1k

点赞数 2

分类专栏：大数据系统与大规模数据分析课程

大数据系统与大规模数据分析课程专栏收录该内容

16 篇文章 3 订阅

订阅专栏

本文转载自： http://www.cnblogs.com/luchen927/archive/2012/02/04/2334316.html

推荐系统的任务就是解决上述的问题，联系用户和信息，一方面帮助用户发现对自己有价值的信息，另一方面让信息能够展现在对他感兴趣的人群中，从而实现信息提供商与用户的双赢。

电影推荐系统问题：根据用户对已看过电影的打分，对用户未看过的电影(下表中以?表示)进行打分估计，以给其推荐合适的电影。

主要分为基于内容的推荐和协同过滤算法。涉及到SVD分解和随机梯度下降算法。

基于内容的推荐

中心转到了物品本身。使用物品本身的相似度而不是用户的相似度。

　　

　　系统首先对物品（图中举电影的例子）的属性进行建模，图中用类型作为属性。在实际应用中，只根据类型显然过于粗糙，还需要考虑演员，导演等更多信息。通过相似度计算，发现电影A和C相似度较高，因为他们都属于爱情类。系统还会发现用户A喜欢电影A，由此得出结论，用户A很可能对电影C也感兴趣。于是将电影C推荐给A。

　　优势：

　　对用户兴趣可以很好的建模，并通过对物品属性维度的增加，获得更好的推荐精度

　　不足：

　　a 物品的属性有限，很难有效的得到更多数据

　　b 物品相似度的衡量标准只考虑到了物品本身，有一定的片面性

　　c 需要用户的物品的历史数据，有冷启动的问题

协同过滤

　　协同过滤是推荐算法中最经典最常用的，具体的思路我已经在之前的一篇文章中提到过，大家可以去看一下。

　　这里只想介绍一下协同过滤中的方法和刚才提到方法的区别。

　　大家都知道协同过滤分为基于用户的协同过滤和基于物品的协同过滤。那么他们和基于人口学统计的推荐和基于内容的推荐有什么区别和联系呢？下面简单介绍一下。

　　基于用户的协同过滤——基于人口统计学的推荐

　　基于用户的协同过滤推荐机制和基于人口统计学的推荐机制都是计算用户的相似度，并基于“邻居”用户群计算推荐，但它们所不同的是如何计算用户的相似度，基于人口统计学的机制只考虑用户本身的特征，而基于用户的协同过滤机制可是在用户的历史偏好的数据上计算用户的相似度，它的基本假设是，喜欢类似物品的用户可能有相同或者相似的口味和偏好。

　　基于物品的协同过滤——基于内容的推荐

　　基于项目的协同过滤推荐和基于内容的推荐其实都是基于物品相似度预测推荐，只是相似度计算的方法不一样，前者是从用户历史的偏好推断，而后者是基于物品本身的属性特征信息。

　　协同过滤的优势：

　　a 它不需要对物品或者用户进行严格的建模，而且不要求物品的描述是机器可理解的，所以这种方法也是领域无关的。

　　b 这种方法计算出来的推荐是开放的，可以共用他人的经验，很好的支持用户发现潜在的兴趣偏好

　　不足：

　　a 方法的核心是基于历史数据，所以对新物品和新用户都有“冷启动”的问题。

　　b 推荐的效果依赖于用户历史偏好数据的多少和准确性。

　　c 在大部分的实现中，用户历史偏好是用稀疏矩阵进行存储的，而稀疏矩阵上的计算有些明显的问题，包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等等。

　　d 对于一些特殊品味的用户不能给予很好的推荐。

　　e 由于以历史数据为基础，抓取和建模用户的偏好后，很难修改或者根据用户的使用演变，从而导致这个方法不够灵活。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

bakalaka CSDN认证博客专家 CSDN认证企业博客

码龄7年

0: 原创

9万+: 周排名

206万+: 总排名

19万+: 访问

: 等级

1650: 积分

121: 粉丝

98: 获赞

21: 评论

677: 收藏

私信

关注

热门文章

分类专栏

最新评论

自适应滤波器：LMS算法、归一化LMS滤波器
weixin_57277491: M 應該就是指 filter order 吧？
自适应滤波器：LMS算法、归一化LMS滤波器
weixin_57277491: 你好，可以請教如何調整filter order 嗎？
自适应滤波器：递归最小二乘（RLS）
小陈IT: % [s, fs, bits] = wavread('myspeech.wav'); [s,fs] = audioread('myspeech.wav');%读取音频文件,调用音频文件，采样值放在x中，fs为采样频率X=x(:,1);%取矩阵x的第一列赋值到x矩阵中 ainfo=audioinfo('myspeech.wav'); bits=ainfo.BitsPerSample; s=s-mean(s); s=s/max(abs(s)); N=length(s); time=(0:N-1)/fs; clean=s'; ref_noise=.1*randn(1,length(s)); mixed = clean+ref_noise; mu=0.05;M=2;espon=1e-4; % [en,wn,yn]=lmsFunc(mu,M,ref_noise,mixed); % [en,wn,yn]=nlmsFunc(mu,M,ref_noise,mixed,espon); delta = 1e-7; lambda = 1; [en,w]=rls(lambda,M,ref_noise,mixed,delta); function [e,w]=rls(lambda,M,u,d,delta) % recursive least squares,rls. % Call: % [e,w]=rls(lambda,M,u,d,delta) % % Input arguments: % lambda = constant, (0,1] % M = filter length, dim 1x1 % u = input signal, dim Nx1 % d = desired signal, dim Nx1 % delta = constant for initializaton, suggest 1e-7. % % Output arguments: % e = estimation error, dim Nx1 % w = final filter coefficients, dim
自适应滤波器：LMS算法、归一化LMS滤波器
pppomm: 你好，可以发一下完整代码吗？现在的画不出图
自适应滤波器：LMS算法、归一化LMS滤波器
flyingpigeightquit: 博主你好，滤除50hz的算法，会同时对比较宽的一个带宽都有较强衰减，比如200hz的信号也被衰减的很厉害，请问有什么可以分享的方法吗？

大家在看

java连接redis数据库简单操作（小白）

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。