推荐系统项目基础(五)基于内容的推荐
基于内容的推荐算法
所谓基于内容的推荐算法(Content-Based Recommendations)是基于标的物相关信息、用户相关信息及用户对标的物的操作行为来构建推荐算法模型,为用户提供推荐服务。这里的标的物相关信息可以是对标的物文字描述的metadata信息、标签、用户评论、人工标注的信息等。或者是本身内容的相关标签(例如通过tfidf,Word2vec的方式进行向量计算)。
其核心是基于画像(特征)进行推送。
实施步骤:
- 构造物品的特征是属性
- 计算物品之间的相识度,相识度的计算依赖于属性值,相识度的算法可以是pearson系数,consin相识度,欧式距离等
- 计算用户对相似物品的喜好程度
- 推送评分高的物品给用户
基于内容与基于物品推荐的区别
基于内容与基于物品协同过滤推荐的相同点
- 都是基于物品的相似度计算得到的
基于内容与基于物品协同过滤推荐的区别
- 基于物品协同过滤中需要从实际生产数据中获取信息,通过用户与物品的矩阵获取物品的相似度
- 针对内容的获取,不需要线上的数据,只需要内容中进行提取向量即可