解决长尾效应的相似度(用于推荐)
wbcosine(Web Scale Cosine Similarity)
其中,
U
i
U_i
Ui是浏览商品i的用户集合,如果
W
u
=
1
W_u=1
Wu=1,那么就是标准的余弦函数。一般取
W
u
=
1
log
2
(
3
+
q
u
)
W_u = \frac{1}{\log_2(3+q_u)}
Wu=log2(3+qu)1,其中
q
u
q_u
qu是用户浏览的商品数,也就是说用户越活跃贡献越小。但是只是打压了热门用户,没有改变热门商品。
Swing
其中,
U
i
U_i
Ui是浏览商品i的用户集合,
I
u
I_u
Iu是用户u浏览过的物品集合;
α
\alpha
α是一个平滑常数,一般为1.
主要思想就是,如果大量用户同时喜欢两个物品,且这些用户之间的相关性低,那么这两个物品就是强相关的。
对活跃用户进行惩罚