1. 计算用户对标签的的喜爱程度
用户对物品的喜欢程度a(可以使用频次来计算)
物品与标签的相关度b(有该标签为1,没有该标签为0)
用户对标签的喜爱程度可以使用a*b得到
加入平滑因子可以使当评分行为较少时产生的误差
rate(u,t)用户u对标签t的喜爱程度
rate(u,i)用户u对物品i的喜爱程度
rel(i,t)物品i于标签t的相关度
2. 计算用户对标签的依赖程度
用户对某个标签使用的次数越多,用户对该标签的依赖程度就越大。
n(u,t)用户对标签t的使用次数
分母:用户使用的所有标签的次数之和
优化:需要对热门的使用标签进行惩罚,原理和it-idf一样
分子:所有用户数
分母:使用该标签的用户数
依赖公式为:tf-idf = TF(u,t)* IDF(u,t)
所以最后计算用户对标签的喜爱程度的公式为:
pre(u,t) = rate(u,t)*TF-IDF(u,t)
预测建模
用户对标签的兴趣矩阵Tu
商品的标签基因矩阵Ti
用户对商品的喜爱程度的预测公式可以为:
从最终的结果里面选取k个用户推荐给用户