1 推荐系统概论
推荐系统可以分为三个阶段
- 人类手工生成的推荐系统
早期的门户网站,里面的内容都是由网站编辑手工选择的,这也是一种原始的推荐系统 - 简单的聚合推荐系统
例如KTV里面的歌曲点播排行榜,畅销书排行榜,电影票房排行榜,按照物品的时间性质推荐,例如最近上架的新品推荐 - 真正的个性化,千人千面的推荐系统
Amazon的商品推荐,Netflix的电影推荐
2 基于内容的推荐
基本思想:给用户推荐与其曾经喜爱的物品相似的物品(基于物品自身的属性)
其核心是首先构造商品画像,之后根据此画像来寻找最相似的其他商品。
如何来判断哪些是最相似的商品? 计算相似度!最经典的评估方法就是使用余弦相似度。
比如我之前在京东上购买了三本书,那这时候需要把每本书表示成一个向量,之后再从库里面寻找跟这三本书比较相近的其他的书籍。
3 商品向量的构建
假如我们给一部电影构造物品画像。那这时候我们可以参考这部电影的标题、导员、演员等等信息。
怎么把文本表示成向量?
可以直接使用tf-idf的方式即可以转换成向量的形式。当然我们也可以使用word2vec等技术来表示成向量的。