分区之按照手机号分区

最新推荐文章于 2021-11-04 08:43:09 发布

Little friend

最新推荐文章于 2021-11-04 08:43:09 发布

阅读量362

点赞数

本文链接：https://blog.csdn.net/weixin_43797368/article/details/107982821

版权

先确定要加分区的位置，是在map之后加的
当需要将统计结果输出到不同的文件中就需要自定义分区并且设置：
//8 指定自定义分区器
job.setPartitionerClass(ProvincePartitioner.class);

    //9 同时指定相应数量的ReduceTask
    job.setNumReduceTasks(5);

默认分区器HashPartitioner，自定义一个分区类ProvincePartitioner并且让这个类继承Partitioner，还要实现getPartition（）方法
public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
在getPartition（）方法中写自己需要的分区需求

，再序列化的基础之上增加分区的功能
写一个分区类ProvincePartitioner
public class ProvincePartitioner extends Partitioner<Text, FlowBean> {
@Override
public int getPartition(Text text, FlowBean flowBean, int numPartitions) {
//获取手机号前三位prePhone
String phone = text.toString();
String prePhone = phone.substring(0, 3);
这里要注意传入的两个参数，是map的输出KV，<Text, FlowBean>

（4）在驱动函数中增加自定义数据分区设置和ReduceTask设置

    //8 指定自定义分区器
    job.setPartitionerClass(ProvincePartitioner.class);

    //9 同时指定相应数量的ReduceTask
    job.setNumReduceTasks(5);

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Little friend

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

手机号码号段分区工具

05-14

号码分类工具，可自己管理号段，对号码进行分区，需.net2.0支持

电话号码分区案例

知其然，知其所以然

11-08

1053

需求：要求将统计结果按照条件输出到不同文件中（分区）。比如：将统计结果按照手机号不同的运营商输出到不同文件中（分区）数据样本模式：一共180万个电话号码左右这个是Mapl类代码： package com.itstar.mr.wc0908.Partition; import org.apache.hadoop.io.LongWritable; import org...

参与评论您还未登录，请先登录后发表或查看评论

2.2.9 hadoop体系之离线计算-mapreduce分布式计算-流量统计之手机号码分区

敲代码的乔帮主

10-10

312

目录 1.需求分析 2.代码方案 2.1 自定义分区 2.2 JobMain添加分区设置 2.3 分区结果 1.需求分析在需求一的基础上，继续完善，将不同的手机号分到不同的数据文件的当中去，需要自定义分区来实现，这里我们自定义来模拟分区，将以下数字开头的手机号进行分开 135 开头的数据到一个分区文件 136开头的数据到一个分区文件 137开头的数据到一个分区文件其他数据到一个分区文件 2.代码方案 2.1 自定义分区 package ucas.mapreduce_flow

MapReduce实例 - partitioner 分区实现按号段统计手机号码

weixin_47316344的博客

07-02

573

一、partitioner类 Partitioner 的功能是在 Map 端对 key 进行分区。Map端最终处理的<key,value>对需要发送到 Reduce 端去合并，合并的时候，相同分区的<key,value>对会被分配到同一个 Reduce 上，这个分配过程就是由 Partitioner（分区）决定的。 MapReduce 默认的Partitioner 是HashPartitioner。其计算方法如下： Partitioner 先计算 key 的散列值（通常是 MD5

第2节 mapreduce深入学习：10、手机号码进行分区

weixin_30716725的博客

06-15

248

需求三：手机号码分区在需求一的基础上，继续完善，将不同的手机号分到不同的数据文件的当中去，需要自定义分区来实现，这里我们自定义来模拟分区，将以下数字开头的手机号进行分开 135 开头数据到一个分区文件 136 开头数据到一个分区文件 137 开头数据到一个分区文件 138 开头数据到一个分区文件 139 开头数据到一个分区文件其他分区注意：必须到集群上运行，否则报错...

ADB读取分区备份分区写入分区的小工具

03-04

开机usb调试开启状态下读取分区和对应的分区号根据安卓版本的不同。个别机型写入分区需要root权限然后可以备份分区写入分区和备份全分区等等操作会一些玩机基础常识的友友下载使用小白谨慎资源有复制性。下载...

android9.0-10.0安卓adb清除分区工具

09-01

这通常需要连续点击“关于手机”中的“版本号”7次来解锁开发者选项。接着，确保你的电脑上已经安装了最新的Android SDK Platform Tools，这个工具包包含了ADB。连接你的Android设备到电脑，确保USB驱动已经正确...

小米8传感器分区文件persist.img+修复步骤

11-13

小米8传感器分区文件persist.img+修复步骤资源说明：如果你刷机更新降级或者刷写第三方系统或者修改系统文件后有以下问题，应该就是传感器分区出问题了以下问题包括但不限于全部 1-----相机打不开或者反应...

Mantine如何实现分区手机号输入

最新发布

09-11

关于分区手机号输入，Mantine本身并没有直接提供一个特定的分区手机号输入组件。但是，你可以通过组合使用Mantine提供的输入框（Input）组件和一些自定义逻辑来实现这一功能。具体实现步骤如下： 1. 首先，你需要...

Partitioner之手机号不同运营商分区

weixin_43520450的博客

04-13

752

手机号不同运营商分区1.需求：2.数据准备：3.分析：4.代码实现：(1)PartitionMapper类：(2)PhionPartition类:(3)PartitionReduce类：(4)PartitionDriver类:5.运行结果: —————— —————— —————— —————— —————— —————— —————— —————— ——————...

分片字段userId-用手机号查询

重点在于记录

12-24

1151

选取好分片字段，数据库分片就完成了一大半面对用户维度（2C）的业务我们最常用的分片字段就是user_id，但登录基本都拿手机号（没见过拿user_id的）这样的场景怎么实现呢？下面我们提供三种实现方案：一、维护映射关系在数据库新建表，表只有两列，维护手机号-user_id的映射同时将映射表数据维护到缓存；操作顺序如下用户注册时拿手机号查询缓存，如果不存在直接走注册流程...

按照不同的运营商将手机号分区

zhanglei_16的博客

06-15

375

1：随机生成10万个手机号，并输入到文件 package Phone_count; import java.io.FileNotFoundException; import java.io.PrintWriter; import java.io.UnsupportedEncodingException; import java.util.ArrayList; import java.util....

大数据hadoop入门案例2--对手机号码序列化+切片+分区

qq_42754919的博客

05-26

572

大数据hadoop入门案例–序列化+分区+排序此博客作为本文学习hadoop大数据内容，内容可能存在不够全面或者存在偏差。文章目录1.定义2.代码2.1FlowBean 序列化代码2.2Partitioner分区代码2.3Mapper代码2.4Reducer代码2.4Driver代码3.输入，输出3.1输入数据3.2输出 1.定义 1.序列化：将内存中的对象转化为字节序列以便存储到磁盘和网络传输。 2.反序列化：将收到的字节序列或磁盘的持久化数据转换为内存中的对象。 3.切片：在逻辑上将数据分

[大数据]Hadoop(3)MapReduce(3)

RegulusF的博客

04-12

206

3.2 Shuffle机制在Map方法之后，Reduce方法之前的数据处理过程称之为Shuffle。 3.2.1 Shuffle机制： shuffle过程：（1）MapTask收集我们的map()方法输出的kv对，放到内存缓冲区中。（2）从内存缓冲区不断溢出本地磁盘文件，可能会溢出多个文件。（3）多个溢出文件会被合并成大的溢出文件。（4）在溢出过程及合并的过程中，都要调用Partitioner进行分区和针对key进行排序。（5）ReduceTask根据自己的分区号，去各个MapTask机器上取

大数据-经典案例手机号码分区

逍遥云恋

12-23

1221

需求三: 手机号码分区在需求一的基础上，继续完善，将不同的手机号分到不同的数据文件的当中去，需要自定义分区来实现，这里我们自定义来模拟分区，将以下数字开头的手机号进行分开自定义分区作业运行添加分区设置 job.setPartitionerClass(FlowPartition.class); 修改输入输出路径, 并放入集群运行 ...

【MapReduce】基础案例 ---- 自定义Partitioner分区 ( 按手机号分区 )

懂得一千零一种,赋予你失败的方法！

01-13

1400

文章目录自定义Partitioner分区▪ 自定义分区基本步骤▪ 案例需求分析代码实现PhoneBean封装类ProvincePartitioner分区类Mapper阶段Reducer阶段Driver阶段自定义Partitioner分区 ▪ 自定义分区基本步骤返回顶部 ▪ 案例需求分析将统计结果按照手机归属地不同省份输出到不同文件中（分区）（1）输入数据（2）期望输出数据 手机号136、137、138、139开头都分别放到一个独立的4个文件中，其他开头的放到一个文件中。返回顶部..

MapReduce案例实操---对电话号码进行分区

qq_50678909的博客

11-04

1182

通过MapReduce原理进行简单的分区。操作内容 1. 需求将统计结果按照手机号前三位输出到不同文件中（分区）（1）输入数据（2）期望输出数据 手机号 136、137、138、139 开头都分别放到一个独立的 4 个文件中，其他开头放到一个文件中（3）在序列化作业的基础上，增加一个分区类 2. 需求分析 1. 需求：将统计结果按照手机归属地不同省份输出到不同文件中（分区） 2. 数据输入 3. 期望数据输出 4. 增...

oracle分区的四种方式