- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 itemcf的hadoop实现优化(Python)
原始数据如下: u1 a,d,b,c u2 a,a,c u3 b,d u4 a,d,c u5 a,b,c 计算公式使用:sim = U(i)∩U(j) / (U(i)∪U(j)) 其中: (U(i)∪U(j)) = U(i) + U(j) - U(i)∩U(j) 原始的Hadoop实现需要5轮MR,优化后只需要两轮就可以完成。 之前的轮数过多,主要在于计算(U(i)∪U(j
2015-02-04 14:42:03 1730 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人