BigData-07:MapReduce基础

一、MapReduce编程案例:求部门的工资总额

1、员工表
SQL:select deptno,sum(sal) from emp group by deptno;
2、分析数据处理的过程
3、开发程序
4、求每个部门的平均工资
在这里插入图片描述
emp员工表:

员工编号员工姓名员工职位员工老板编号员工入职日期月薪资奖金部门编号
7369SMITHCLERK79021980/12/17800020
7499ALLENSALESMAN76981981/2/20160030030
7521WARDSALESMAN76981981/2/22125050030
7566JONESMANAGER78391981/4/22975020
7654MARTINSALESMAN76981981/9/281250140030
7698BLAKEMANAGER78391981/5/12850030
7782CLARKMANAGER78391981/6/92450010
7788SCOTTANALYST75661987/4/193000020
7839KINGPRESIDENT-11981/11/175000010
7844TURNERSALESMAN76981981/9/81500030
7876ADAMSCLERK77881987/5/231100020
7900JAMESCLERK76981981/12/3950030
7902FORDANALYST75661981/12/33000020
7934MILLERCLERK77821982/1/231300010

dept部门表:

部门编号部门名称部门所在地
10ACCOUNTINGNEW YORK
20RESEARCHDALLAS
30SALESCHICAGO
40OPERATIONSBOSTON

代码实现:

//                                              k1          v1      k2          v2
public class SalaryTotalMapper extends Mapper<LongWritable, Text, IntWritable, IntWritable> {
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        // 数据:7369,SMITH,CLERK,7902,1980/12/17,800,0,20
        String line = value.toString();

        // 切分
        String[] words = line.split(",");

        // 输出          k2:部门号      v2:员工工资
        context.write(new IntWritable(Integer.parseInt(words[7])),
                new IntWritable(Integer.parseInt(words[5])));
    }
}
//                                                 k3        v3          k4          v4
public class SalaryTotalReducer extends Reducer<IntWritable,IntWritable,IntWritable,IntWritable> {
    @Override
    protected void reduce(IntWritable key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
        // 对v3求和
        int total = 0;
        for (IntWritable value : values) {
            total += value.get();
        }

        // 输出k4部门号  v4部门的工资总额
        context.write(key, new IntWritable(total));
    }
}
public class SalaryTotalMain {
    public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {
        // 1.创建任务
        Job job = Job.getInstance(new Configuration());
        // 程序的入口
        job.setJarByClass(SalaryTotalMain.class);

        // 2. 指定map类和map的输出类型
        job.setMapperClass(SalaryTotalMapper.class);
        job.setMapOutputKeyClass(IntWritable.class);
        job.setMapOutputValueClass(IntWritable.class);

        // 3. 指定reduce类和reduce输出类型(就是最终结果的输出类型)
        job.setReducerClass(SalaryTotalReducer.class);
        job.setOutputKeyClass(IntWritable.class);
        job.setOutputValueClass(IntWritable.class);

        // 4. 指定输入路径,任务结果输出路径
        FileInputFormat.setInputPaths(job, new Path(args[0]));
        FileOutputFormat.setOutputPath(job, new Path(args[1]));

        // 5. 执行任务
        job.waitForCompletion(true);
    }
}

二、MapReduce的高级特性

1、序列化
	(*) 复习:Java的序列化
	(*) MapReduce的序列化:核心接口:Writable
	                       如果一个类实现了Writable接口,该类的对象可以作为key和value
			举例1:读取员工数据,生成员工的对象,直接输出到HDFS
			举例2:使用MapReduce序列化重写“求部门工资的总额的例子”
			
2、排序
	(*)规则:按照Key2排序
	(*)基本数据类型
			(1)数字:   默认:升序
			              可以改变默认的排序规则(创建自己的比较器即可)
						  
			(2)字符串: 默认:字典顺序
			              可以改变默认的排序规则(创建自己的比较器即可)
	
	(*)对象

3、分区
4、合并

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

phial03

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值