推荐好友
a -> b,c,d
b -> a,c,e
-------------
a-b ab_cd
a-c ac_bd
a-d ad_bc
b-a ba_ce
b-c bc_ae
b-e be_ac
-------------
b-> d
a-> e
已经直接可以排除ac是好友的情况了
~~~~~~~~~~~~~~~~~~~~~~~~~
不需要提前将相互关注的好友,只保留一条数据,因为即使是两条在reduce中已经set去重了
a b
b c
b a
map:
key:主 value:从
key:从 value:主
结果:a b ,b a, b c, c b,a b,b a
reduce:
根据key,将values做笛卡尔积,得到的结果可能是二度关系(因为这里面包括已经是好友的情况)
结果:a c
在经过一个mr去排除已经是好友的情况即可能ac已经是好友了
hadoop求推荐好友-2度关系
最新推荐文章于 2022-04-22 11:20:38 发布