spark groupByKey 循环数组 行转列
使用spark-shell 通过groupByKey方法将行专列。
一、需求
在HDFS或本地目录有一份text格式数据(数据内容为英文逗号分隔,字段内容为uid,value,key),现在要求将这些数据按照uid分组,
cat /home/hadoop/janusgraph-data/source.csv
299067472793701,1003422322c6c937c63af250637...
原创
2020-03-23 18:23:56 ·
576 阅读 ·
0 评论