最近刚刚参加实习,主要工作是做推荐算法,下面主要总结一下这几天看到的内容。
常用的推荐算法:
1,基于内容的推荐算法;
2,协同过滤的推荐算法;
3,基于关联规则推荐;
4,基于效用的推荐;
常用的推荐算法适用场景也不一样,基于内容的推荐算法和协同过滤的推荐算法比较适合向有意向但是还没有购买的用户进行推荐,而基于关联规则的推荐算法更适用于已经购买了
这一篇文章主要介绍一下基于内容的推荐算法(Content-based Recommendations ),其他算法在后续文章中陆续介绍。
基于内容的推荐算法,说白了就是根据用户以往浏览的内容或者项目(本文称为项目Item)来为用户推荐相似度高的item。
基于内容的推荐算法主要分为三步:
第一步:
提取item的特征:提取item的一些特征主要是为了方便表示item;
第二步:
提取用户的喜好特征:根据用户以往对item的喜好来学习出用户的喜好特征;
第三步:
根据用户的喜好特征为用户推荐最相似的item;
下面详细介绍一下各个步骤:
第一步:提取item特征
现实中每个item都会有很多属性。属性一般可以分为两类:结构化的属性和非结构化的属性。结构化属性是指属性的意义比较明确,其取值限定在某个范围;而非结构化的属性往往其意义不太明确,取值也没什么限制,不好直接使用。比如对一篇文档来说,文档大小等就是结构化属性,而文档的内容就是一种非结构话的属性。
第二步:用户