1. 什么是基于内容推荐?
其实就是基于物品的属性进行推荐
2. 实施步骤:
a. 构造物品的特征是属性
b. 计算物品之间的相识度,相识度的计算依赖于属性值,相识度的算法可以是pearson系数,consin相识度,欧式距离等
c. 计算用户对相似物品的喜好程度
d .推送评分高的物品给用户
3. 各步骤细说
a. 构建特征的方式
构建结构化特征,如果物品是手机,那么它的品牌,颜色,内存大小,屏幕大小等就是机构化的信息。
非结构化信息:往往来源于描述性的文本,需要提取文本得到。如果说商品的标题“华为 Nova5z 麒麟810芯片 4800万ai四摄 3200万人像超级夜景 全网贯通双卡双待” ,从中我们可以提取到结构:像素:4800, 芯片类型:麒麟810, 是否全网通:是, 是否双卡双待:是。
数据处理:对于离散的数据类型,往往使用独热编码的方式处理。对于连续的数据类型,往往需要归一化处理。
4. 下面通过一个电影推荐的例子来介绍基于内容的推荐算法的流程
a. 构建电影的特征矩阵,在例子中电影的特征只有电影类型这一个。需要对这个类型做独热化表示,共有18个维度
b. 构建用户对各个类型电影的平均评分,也是个18维度的矩阵。
c. 求用户没有看过的电影的特征矩阵与用户评论矩阵的相识度,使用cosin余弦相识度。
d. 取相识度最高的几个进行推荐
e. 效果评估:预测时不将客户已经看过的电影去除,将预测结果与用户实际看过的电影列表进行对比,求命中率。