Top25:推荐系统简介

一.推荐系统引入

1.什么是推荐系统?

个性化推荐系统
在面对用户信息过载的情况下或者在用户没有明确购买信息的情况下,通过程序或工具自动化实现商品和服务的自动推荐过程。(而不依赖于外部专家)

2.有什么用?

推荐系统的任务就是能够连接信息与用户,帮助用户找到其感兴趣的信息,
同时让一些有价值的信息能够到达潜在的用户中。

3.如何推荐?

分析该用户的兴趣,从海量信息中选择出与用户兴趣相似的信息,并将这些信息推荐给用户。

4.为什么使用推荐系统

信息过载:
随着互联网行业的发展,信息量也在以几何倍数式爆发增长。
垃圾信息越来越多,导致用户获取有价值信息的成本大大增加。
由于信息的爆炸式增长,对信息获取的有效性,针对性的需求也就自然出现了。

5.可以用在哪些方面(用途和使用场景)?

用途:系统收集到用户的行为数据,通过推荐算法推荐用户很可能感兴趣的文章、视频、音频等内容

使用场景:图书推荐;QQ好友推荐;优酷,爱奇艺的视频推荐;豆瓣的音乐推荐;大从点评的餐饮推荐;世纪佳缘的相亲推荐;智联招聘的职业推荐。

如:

今日推荐:通常是根据用户的近期的历史购买或者查看记录,并结合时下流行的物品给出一个折中的推荐

新产品的推荐:基于内容的推荐机制。将一些新到物品推荐给用户。在方法选择上由于新物品没有大量的用户喜好信息,所以基于内容的推荐能很好的解决这个“冷启动”的问题。

捆绑销售:基于项目的协同过滤推荐机制。采用数据挖掘技术对用户的购买行为进行分析,找到经常被一起或同一个人购买的物品集,进行捆绑销售

他人购买 / 浏览的商品:基于项目的协同过滤推荐的应用,通过社会化机制用户能更快更方便的找到自己感兴趣的物品。

6.混合的推荐机制

流行的组合方法:

加权的混合:用线性公式将几种不同的推荐按照一定权重组合起来,具体权重的值需要在测试数据集上反复实验,从而达到最好的推荐效果。

切换的混合:对于不同的情况(数据量,系统运行状况,用户和物品的数目等),推荐策略可能有很大的不同,
那么切换的混合方式,就是允许在不同的情况下,选择最为合适的推荐机制计算推荐。

分区的混合:采用多种推荐机制,并将不同的推荐结果分不同的区显示给用户。
例:Amazon,当当网等很多电子商务网站都是采用这样的方式,用户可以得到很全面的推荐,也更容易找到他们想要的东西。

分层的混合:采用多种推荐机制,并将一个推荐机制的结果作为另一个的输入,从而综合各个推荐机制的优缺点,得到更加准确的推荐。

二.推荐方法简述

基于内容的推荐算法
基于知识的推荐算法
协同过滤推荐算法
混合推荐算法
流行度推荐算法

1.基于内容的推荐系统 (多用于资讯类)

是什么?
针对文章本身抽取一些tag作为该文章的关键词,继而可以通过这些tag来评价两篇文章的相似度。

怎么做?
在一篇文章中,那些出现频率高的(除停用词)词,并且在其他文章中出现频率较低的词更能代表这篇文章的内容。 经过TF-IDF公式计算,权重大于某一阈值的term作为该文章的tag。

优点
1.易于实现,不存在稀疏性和冷启动问题(因为不需要用户数据),
2.不存在过度推荐热门的问题(基于item本身特征推荐)
3.所涉及的技术都是搜索引擎中应用比较成熟的技术

缺点
抽取的特征既要保证准确性又要具有一定的实际意义,否则很难保证推荐结果的相关性。
例:豆瓣网采用人工维护tag的策略,依靠用户去维护item的tag的准确性。

三.推荐经验之谈

(1) 确定你真的需要推荐系统。
推荐系统只有在用户遇到信息过载时才必要。如果你的网站物品不太多,或者用户兴趣都比较单一,那么也许并不需要推荐系统。所以不要纠结于推荐系统这个词,不要为了做推荐系统而做推荐系统,而是应该从用户的角度出发,设计出能够真正帮助用户发现内容的系统,无论这个系统算法是否复杂,只要能够真正帮助用户,就是一个好的系统。

(2) 确定商业目标和用户满意度之间的关系。
对用户好的推荐系统不代表商业上有用的推荐系统,因此要首先确定用户满意的推荐系统和商业上需求的差距。一般来说,有些时候用户满意和商业需求并不吻合。但是一般情况下,用户满意度总是符合企业的长期利益,因此这一条的主要观点是要平衡企业的长期利益和短期利益之间的关系。

(3) 选择合适的开发人员。
一般来说,如果是一家大公司,应该雇用自己的开发人员来专门进行推荐系统的开发。

(4) 忘记冷启动的问题。
不断地创新,互联网上有任何你想要的数据。只要用户喜欢你的产品,他们就会不断贡献新的数据。

(5) 平衡数据和算法之间的关系。
使用正确的用户数据对推荐系统至关重要。对用户行为数据的深刻理解是设计好推荐系统的必要条件,因此分析数据是设计系统中最重要的部分。数据分析决定了如何设计模型,而算法只是决定了最终如何优化模型。

(6) 找到相关的物品很容易,但是何时以何种方式将它们展现给用户是很困难的。
不要为了推荐而推荐。

(7) 不要浪费时间计算相似兴趣的用户,可以直接利用社会网络数据。

(8) 需要不断地提升算法的扩展性。

(9) 选择合适的用户反馈方式ctr。

(10) 设计合理的评测系统,时刻关注推荐系统各方面的性能。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Carl_blog

给我点根烟

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值