流行度长尾问题是推荐系统的一个原生问题,就是原来很热门的物品更容易被推荐,原本就很冷门的物品越不容易推荐,即“头大长尾”问题。为了解决这个问题,我们可以先计算出每个物品的流行度ppli=ln(1+|Ni|)
用户相似度:
计算出每个物品的流行度之后,按照以下公式计算用户间的形似度,就是在原先相似度的基础上除以ppli。即,越热门的物品咱给他赋的权重越小。这样还能提高冷门物品的点击率。
物品相似度:
也可以在计算出每个物品的流行度之后,计算阿尔法相似度,阿尔法的计算方式有两种,可通过normalize或者sigmoid来计算。阿尔法是用户可流行度,当阿尔法很大时,因为它在分母上,是相除的形式,所以对流行度有稀释的作用。