最近在研究Hadoop大数据方面的知识,正巧看到了推荐系统,其中里面有个同现矩阵很是让我蒙圈,查了很多blog之后,写下来与大家分享。
1.建立同现矩阵的过程
在协同过滤算法中同现矩阵的建立是极其关键的一部,原始数据如下:
1,101,5.0
1,102,3.0
1,103,2.5
2,101,2.0
2,102,2.5
2,103,5.0
2,104,2.0
3,101,2.0
3,104,4.0
3,105,4.5
3,107,5.0
4,101,5.0
4,103,3.0
4,104,4.5
4,106,4.0
5,101,4.0
5,102,3.0
5,103,2.0
5,104,4.0
5,105,3.5
5,106,4.0