推荐系统学习总结

前段时间参加了泰迪杯数据挖掘挑战赛,选的是B题电视产品营销推荐。由于涉及到推荐系统这一块比较大的知识领域,之前没有学过,于是在比赛之初找了一些网上的资料自学了几天,有了一些初步的了解与认识。因实训的项目中推荐系统仍是很重要的一部分,故重新再复习一遍,加之比赛中的一些感悟作此总结。

附上原版链接,挑选了两个比较不错的链接,通俗易懂,可做入门用。

1.5类系统推荐算法,非常好使,非常全 - CSDN博客

https://blog.csdn.net/u010670689/article/details/71513133

2.探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html#icomments

探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤

https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy2/index.html?ca=drs-

探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类

https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy3/index.html?ca=drs-

所谓推荐,我们联系一下现实,无论是自己给别人推荐还是别人给自己推荐,归根结底是通过寻找相似或者说关联来推荐。以相似和关联这两条主线来理解推荐机制就很容易接受了。

相似:人的相似与物的相似。

基于人口统计学的推荐机制  与  基于内容的推荐机制

基于人口统计学的推荐机制


基于内容的推荐机制


关联:用户为主的关联与物品为主的关联。

基于用户的协同过滤推荐 与 基于项目的协同过滤推荐

基于用户的协同过滤推荐


基于项目的协同过滤推荐



基于物品和用户本身的,这种推荐引擎将每个用户和每个物品都当作独立的实体,预测每个用户对于每个物品的喜好程度,这些信息往往是用一个二维矩阵描述的。由于用户感兴趣的物品远远小于总物品的数目,这样的模型导致大量的数据空置,即我们得到的二维矩阵往往是一个很大的稀疏矩阵。同时为了减小计算量,我们可以对物品和用户进行聚类,然后记录和计算一类用户对一类物品的喜好程度,但这样的模型又会在推荐的准确性上有损失。

——节选自 探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html#icomments 推荐引擎的分类

在做泰迪杯的时候,对推荐系统了解不多,只用最简单的想法去进行编程,最终得出1000多名用户与20多个标签的对应矩阵和1000多部电视产品与20多个标签的对应矩阵,看似成功就在眼前,然而在计算用户相似度和产品相似度的时候却因为矩阵的过于稀疏以及算法的简陋,运算时间远超预想,难以实现。

总结教训,在此次实训中必须要考虑如何聚类分析,对于大量的数据,如果牺牲一定的准确性可以换来运算效率的大幅提升的话,这样的牺牲是很有必要的。

混合的推荐机制

在现行的 Web 站点上的推荐往往都不是单纯只采用了某一种推荐的机制和策略,他们往往是将多个方法混合在一起,从而达到更好的推荐效果。关于如何组合各个推荐机制,这里讲几种比较流行的组合方法。

加权的混合(Weighted Hybridization): 用线性公式(linear formula)将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果。

切换的混合(Switching Hybridization):前面也讲到,其实对于不同的情况(数据量,系统运行状况,用户和物品的数目等),推荐策略可能有很大的不同,那么切换的混合方式,就是允许在不同的情况下,选择最为合适的推荐机制计算推荐。

分区的混合(Mixed Hybridization):采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。其实,Amazon,当当网等很多电子商务网站都是采用这样的方式,用户可以得到很全面的推荐,也更容易找到他们想要的东西。

分层的混合(Meta-Level Hybridization): 采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。

——节选自 探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探

https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html#icomments 推荐引擎的应用 

可以应用在项目实训的推荐里面,考虑一下分区混合的应用。





评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值