推荐系统实践
编著 项亮 参与创建Resys China推荐系统社区
第一章 好的推荐系统
什么是好的推荐系统?什么样的特征?有哪些评价指标?
1.1 好的推荐系统
信息过载 (Information overload)
需要筛选
有明确需求
没有明确需求
解决信息过载
- 分类目录 -- 雅虎
- 搜索引擎 -- 谷歌
推荐系统也是一种帮助用户快速发现有用信息的工具。 和搜索引擎不同的是,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史行为给用 户的兴趣建模,从而主动给用户推荐能够满足他们兴趣和需求的信息。
因此,从某种意义上说, 推荐系统和搜索引擎对于用户来说是两个互补的工具。
搜索引擎满足了用户有明确目的时的主动 查找需求,而推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。
推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们感兴趣但很难发现的商品。
-
社会化推荐(social recommendation),即让好友给自己推荐物品。
-
基于内容的推荐 (content-basedfiltering)。
-
基于协同过滤(collaborative filtering)的推荐。
从上面3种方法可以看出,推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。
通过这一节的讨论,我们可以发现推荐系统就是自动联系用户和物品的一种工具,它能够在 信息过载的环境中帮助用户发现令他们感兴趣的信息,也能将信息推送给对它们感兴趣的用户。
1.2 个性化推荐系统的应用
个性化推荐系统需要依赖用户的行为数据,主要作用是通过分析大量用户行为日志,给不同用户提供不同的个性化页面展示,来提高网站的点击率和转化率。
几乎所有的推荐系统应用都是由前台的展示页面、后台的日志系统以及推荐算法系统3部分构成的。
1.2.1 电子商务
亚马逊
1.2.2 电影和视频网站
Netflix
1.2.3 个性化音乐网络电台
1.2.5 个性化阅读
1.2.6 基于位置的服务
1.2.7 个性化邮件
1.2.8 个性化广告
1.3 推荐系统评测
什么才是好的推荐系统?这是推荐系统评测需要解决的首要问题。一个完整的推荐系统一般存在3个参与方(如图1-22所示):用户、物品提供者和提供推荐系统的网站。
因此在评测一个推荐算法时,需要同时考虑三方的利益, 一个好的推荐系统是能够令三方共赢的系统。
在推荐系统的早期研究中,很多人将好的推荐系统定义为能够作出准确预测的推荐系统。
预测准确度是推荐系统领域的重要指标(没有之一)。
这个指标的好处是,它可以比较容易地通过离线方式计算出来,从而方便研究人员快速评价和选择不同的推荐算法。
但是,很多研究表明,准确的预测并不代表好的推荐。比如准确但没有意义的推荐。
所以,好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发现那些他们可能会感兴趣,但却不那么容易发现的东西。
同时,推荐系统还要能够帮助商家将 那些被埋没在长尾中的好商品介绍给可能会对它们感兴趣的用户。这也正是《长尾理论》的作者在