该案例中我们要实现的是从数据文件中的好友关系中得到两两之间的共同好友,具体实现大致需要通过下面的两个阶段。
第一阶段:
第二阶段:
- 数据准备
将数据上传至HDFS:
[root@hadoop01 test_data]# cat test_mapreduce_friend.txt
A#C,D,E
B#D,E,F
C#A,F
D#A,B
E#A,B
F#B,C
[root@hadoop01 test_data]# hdfs dfs -mkdir /test_multiple_map_input
[root@hadoop01 test_data]# hdfs dfs -put test_mapreduce_friend.txt /test_multiple_map_input