最近在调研推荐系统,在看到slope one方面的资料时,对 slope one算法的实现和原理产生了一些疑问,望大牛不吝指教:
疑问一:slope one算法中需要计算所有商品评分的平均差,但是对于现实推荐应用而言,商品的数量通常为数万级别,而这种规模的商品产生的二项组合已经达到了千万级别,如此大规模的计算量需要使用什么样的计算框架实现?为什么slop one算法还被称之为简单高效的算法?
疑问二:slope one算法中的平均差计算方法并不能很好的表达出两个商品之间的评分差异,考虑到以下极端情况:
A B 商品AB之间的平均差为0,但实际上商品AB之间的评分差异很大。
1 5
5 1