5、当前日志采样格式为如下,请编写MapReduce计算第四列每个元素出现的个数
题目
5、当前日志采样格式为如下,请编写MapReduce计算第四列每个元素出现的个数
a,b,c,d
a,s,d,f
d,f,g,c 就如此格式
思路
上面这个问题是网上很多面试指南中出现的,网上很多编程实例,但是很多把题意理解错了。很多错例只计算了第4列的数量,其他列包含了全给丢了。我认为原题的题意是计算第四列单词在全文的计数。
思路来自于《Hadoop编程指南》中第...
原创
2019-06-07 10:42:20 ·
1009 阅读 ·
2 评论