经常在当当网,卓越亚马逊,京东等购物网站上买东西,他们都使用了个性化推荐系统,其中我觉得亚马逊做的最好,可能是技术在美国的原因吧。
这两个礼拜我仔细看了一篇周涛教授等人写的论文《个性化推荐系统的研究进展》。
里面很全面地介绍了“个性化推荐系统”。主要分为三个部分:
1.收集用户信息的行为记录模块。
2.分析用户喜好的模型分析模块
3.推荐算法模块
其中第三点是最为关键的一部分。
根据推荐算法不同,又把推荐系统分为:(以下为综合论文和Wikipedia、百度等以及自己的思考得到)
(一)协同过滤系统
a. 基于使用者(User-based)的协同过滤
b. 基于物品(Item-based)的协同过滤
c. 基于模型(Model- based)的协同过滤
优点:*对推荐对象没有特殊的要求,能处理音乐,电影等机器难以自动内容分析的资讯。
*可以推荐新的资讯。即可能是使用者事先预料不到的。
*自动化程度高,能够有效地利用其它相似者的回馈资讯。
缺点:*新的用户进来时推荐的品质较差。
(二)基于内容的推荐系统
内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤.
通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前喜欢的产品相似的产品。
简单来说就是和之前购买的产品是同类性质的,如都为C语言教材,或为同一位大师所著。
优点:简单,有效。
缺点:提取特征值有限,只能基于文本内容分析,如遇见音乐电影就没办法了。就要用到上面提到的协同过滤方法。
(三)基于用户--产品二部图网络结构的推荐系统。
这种算法不考虑用户或者产品的内容特征。而是把他们看成抽象的节点,仅仅考虑点和点之间的关系。又分为:
- 基于二部分图资源分配的推荐算法
- 产品的度信息推荐准确度的影响
- 通过去除重复属性获得高精度的算法
- 通过引入耦合阈值提高算法精确性并降低算法复杂性
- 基于传播的用户相似性度量
因为这种算法对数学要求较高,一些度量,计算公式我还在慢慢消化、理解。
(四)混合推荐系统
因为基于协同过滤能够做到推荐 非文本化的内容,而基于内容的过滤又有简单有效的优点,以及二部分图算法又优于协同过滤算法,所以把这些优点都综合起来,形成了混合推荐系统。
暂时只看了这里,发现数学要求还是蛮高的,所以打算等考试考完了,好好学习一下里面的算法,最好能实现之。