寻找用户间的共同好友
下面我们给出一个经典的案例:寻找用户间的共同好友。(有意思的是:网上讨论这个案例的虽多,但都有这那的错误,不是数据错就是程序错, 总有同学和我比对,实际和我的是不一样的)马克-to-win @ 马克java社区:下面给出用户的好友关系列表(注意是单向的, 单向的好友意味着,你是别人的好友,别人可能不是你的好友),每一行代表一个用户和他的好友列表。
A:B,C,D,F,E,O
B:A,C,E,F
C:F,A,D,I
D:A,E,F,L
E:B,C,D,M,L
F:A,B,C,D,E,O,M
G:A,C,D,E,F
H:A,C,D,E,O
I:A,O
J:B,O
K:A,C,D
L:D,E,F
M:E,F,G
O:A,H,I,J
防盗版实名手机尾号:73203。现在需要找出用户间的共同好友。目测:A:B,C,D,F,E,O。 A的好友有这些人。 B:A,C,E,F, B的好友有这些人。A和B的共同好友是C,E,F。其实如果不用大数据的思维,很简单,知道:A:B,C,D,F,E,O。而且B:A,C,E,F得出A -B: C,E,F, 这算法并不难。之后再穷尽一下。(A-B,A-C,A-D。。。。之后再B-C,B-D。。。。二维数组就可以搞定)。但如果数据量大的话,内存就崩了, 得用大数据的思维。
A-B: C,E,F 这结论用大数据来做是这样:第一步:要知道C是A的好友,C还是B的好友。这就要知道C到底是多少人的好友?答案是:C H-K-B-A-G-E-F(即C是这许多人的好友),怎么做,见下?第二步,有了如上的数据,就好做穷尽,AB都是C的好友。AE也是C的好友。以AB为键,马上会发现 AB也都是E的好友,而且也是F的好友。这样,最终的结论就有了:A -B: C,E,F。
这件事用一个MapReduce不行,得用两个,才能搞定。思路是这样:
更多请见:http://www.mark-to-win.com/tutorial/mydb_MapReduce_CommonFriend.html
MapReduce当中寻找用户间的共同好友
最新推荐文章于 2019-08-11 15:05:54 发布