Hadoop学习之MapReduce(ReduceJoin案例)心得

需求:

   在 Reduce端 将商品信息表中数据根据商品pid合并到订单数据表中

(order表:id、pid、amount;product表:pid、pname)


1.TableBean类:

        实现 Writable 接口(序列化),实现序列化和反序列化方法

        定义所有字段,实现空参构造和 get() set() 方法
    
        序列化方法和反序列化方法里的顺序保持一致( out.write() 和 in.read() )

        重写 toString() 方法

2.TableMapper类:

        继承 Mapper 类之后对应相应的泛型

        先写 setup() 方法(初始化),得到切片信息后获取文件名,将其变为全局变量

        重写 map() 方法,获取一行,判断是哪个文件,切割,封装 outK、outV 后写出

3.TableReducer类:

        继承 Reducer 类之后对应相应的泛型

        重写 reduce() 方法,创建集合将 TableBean 传输进去(存储order),创建对象(存储pd)

        循环遍历 通过创建临时对象来赋值添加

        (直接添加在haoop中是传地址而且会覆盖,最终只能加上一个对象而非多个)

        BeanUtils.copyProperties() 赋值

        循环遍历 orderBeans,赋值 pdname (从 pdBean 中 getPname() ),写出

4.TableDriver类:

        获取job,设置jar包的路径(Driver类)

        关联mapper和reducer(自己所写的类)
                
        设置map输出的KV类型,设置最终输出的KV类型
                 
        设置输入和输出路径
                
        提交job

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

顺其自然的济帅哈

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值