题目:使用UDF函数统计出flow.dat日志文件当中每个网站的浏览次数
一:编写MapReduce程序清洗数据
我们需要的是统计日志文件中每个网站的浏览次数,为了方便起见,我们只取网站这一列数据。取出网站数据的这一操作就在map中进行,在reduce中无需对数据做处理。
源码:
MyMapper类
package com.WebsiteCount;
import java.io.IOException;
import org.apache...
原创
2019-01-03 10:56:27 ·
351 阅读 ·
0 评论