1.使用Spark完成单词去重
text02.txt的数据
java php hello word
phpp hi exe java
python hello kitty
php happy abc java
2.使用Spark统计133 136 139开头的总流量
13326293050 81
13626594101 50
13326435696 30
13926265119 40
13326564191 2106
13626544191 1432
13919199499 300
3.完成统计相同字母组成的单词
text01.txt的数数据
abc acb java
avaj bac
cba abc
jvaa php hpp
pph python thonpy