本人从9月份以来开始学习个性化推荐相关算法,主要参考《推荐系统实践》一书,将基于用户行为的四类算法加以实现,特贴此系列文献,从而和大家交流心得体会,不足之处,还望纠正。
首先先介绍下个性化推荐系统,其实现在很多互联网公司都在运用个性化推荐及其相关应用。例如亚马逊的商品推荐(见图一)、豆瓣音乐推荐(见图二)。二者都是利用用户之前在网站的记录对其进行分析与推荐。例如笔者比较喜欢听华语伤感类歌曲,利用豆瓣FM听了不少华语情歌,那么豆瓣推荐《好久不见》再合适不过了。
图1
图2
在介绍完两个实际应用后,我准备介绍下个性化推荐的定义。
Wikipedia称其为recommendation systems are a subclass of information filtering system that seek to predict the 'rating' or 'preference' that a user would give to an item (such as music, books, or movies) or social element (e.g. people or groups) they had not yet considered, using a model built from the characteristics of an item (content-based approaches) or the user's social environment (collaborative filtering approaches).
简单的说,推荐系统就是信息过滤系统所要实现的上层内容。利用图三可以说明,RS就是从海量数据(最近特别热门的大数据)中筛选出用户真正关心的,有价值的内容,向用户进行推荐。
图3
值得说明的是,RS(推荐系统)的出现,与原先搜索引擎出现的原因相同,都是用于解决信息过载的问题。在此不得不将二者进行纵向比较。搜索引擎是基于PULL(拉)的服务,就是你利用关键词组合进行检索,获取信息。所以在许多目标明确的情景下,搜索引擎都能给出很好的服务。但试想一下,倘若用户本身对所要获取信息的表述不明朗,比如用户只想看一部电影,但又没有明确目标。此时使用搜索引擎未必有良好效果。而个性化推荐系统的出现正是弥补这方面的不足。与搜索引擎不同的是,个性化推荐是基于PUSH(推)的服务。用户本身不需要将目标描述的十分清晰,而是利用用户之前记录以及用户所携带的标签(年龄,职业,爱好等)给用户推荐。这样的推荐也并不是没有理由的随机或者热门推荐,而是充满个性化的推荐,更注重长尾数据(关注长尾也是RS的一个重点)。
本文主要简要介绍了个性化推荐系统的几个实际应用,并且概括了个性化推荐的定义,同时将其与搜索引擎进行比较,我会在以后的系列文章中和大家介绍个性化推荐系统的内部实现原理。
推荐阅读:
1.探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探:
https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/
2.个性化推荐技术漫谈:
http://blog.csdn.net/java060515/article/details/1570243
3.个性化推荐:电子商务驱动力:
http://blog.sina.com.cn/s/blog_49f78a4b0102e0dp.html
4.个性化推荐如何抓住人?以豆瓣FM为例
www.huxiu.com/article/3638/1.html