分析说明
本文主要对下面博文进行分析
基于物品的协同过滤算法
原文中的公式:
W
i
j
=
∣
N
i
∩
N
u
∣
∣
N
i
∣
W_{ij}=\dfrac{|N_i \cap N_u|}{|N_i|}
Wij=∣Ni∣∣Ni∩Nu∣
W i j W_{ij} Wij 表示物品i和j之间的相似度;
那么这个公式可以用条件概率的方法推导,那么
W
i
j
W_{ij}
Wij其实可以表示为用户在喜欢物品i的条件下,又喜欢物品j的概率,类似公式如下:
W
i
j
=
P
(
j
∣
i
)
=
P
(
i
j
)
P
i
W_{ij}=P(j|i)=\dfrac{P(ij)}{Pi}
Wij=P(j∣i)=PiP(ij)
隐语义模型
R,P,Q这三个矩阵为例,其中的class1,class2,class3 三个类别,其实可以理解为对物品的3个特征参数(
x
1
,
x
2
,
x
3
x_1,x_2,x_3
x1,x2,x3),即表示分别属于这3中类别的程度用数值表示,将Q矩阵转置一下(即
Q
T
Q^T
QT)更为合理些,以物品item为样本点集合,那么P矩阵就是每个用户对3个特征参数的
θ
\theta
θ向量构成的矩阵,这里的
θ
\theta
θ属于3维向量,P矩阵为用户数量*3。
那么R矩阵也进行转置(即
R
T
R^T
RT)就合理了,它表示用户对每一个物品的喜好程度的数值表示矩阵,这就和吴恩达机器学习中的电影评分推荐的讲解比较吻合了。