通过MapReduce原理进行简单的分区。
操作内容
1. 需求
将统计结果按照手机号前三位输出到不同文件中(分区)
(1) 输入数据
(2) 期望输出数据
手机号 136、137、138、139 开头都分别放到一个独
立的 4 个文件中,其他开头放到一个文件中
(3) 在序列化作业的基础上,增加一个分区类
2. 需求分析
1. 需求:将统计结果按照手机归属地不同省份输出到不同文
件中(分区)
2. 数据输入
3. 期望数据输出
4. 增加一个 ProvincePartitioner 分区
5. Driver 驱动类
这是所用到的phone_data.txt
1 13736230513 192.196.100.1 www.atguigu.com 2481 24681 200
2 13846544121 192.196.100.2 264 0 200
3 13956435636 192.196.100.3 132 1512 200
4 13966251146 192.168.100.1 240 0 404
5 18271575951 192.168.100.2 www.atguigu.com 1527 2106 200
6 84188413 192.168.100.3 www.atguigu.com 4116 1432 200
7 13590439668 192.168.100.4 1116 954 200
8 15910133277 192.168.100.5 www.hao123.com 3156 2936 200
9 13729199489 192.168.100.6 240 0 200
10 13630577991 192.168.100.7 www.shouhu.com 6960 690 200
11 15043685818 192.168.100.8 www.baidu.com 3659 3538 200
12