MapReduce-day06-第三章框架原理-3.8MapReduce总结

1:InputFormat

        1:默认的是TextInputFormat        kv        key:偏移量,v:一行内容

        2:处理小文件CombineTextInputFormat        把多个文件合并到一起统一切片

2:Mapper

        setup:初始化

        map:用户的业务逻辑

        clearup:关闭资源

3:shuffle分区

        默认分区:HashPartitioner,默认按照key的Hash值%numreducetask个数

        自定义分区

4:排序

        1:部分排序        每个输出的文件内部有序。

        2:全排序        一个reduce,对所有数据大排序

        3:二次排序        自定义排序范畴,实现writableCompare接口,重写CompareTo方法

                总流量倒序,上行流量正序

5:Combiner

        前提:不影响最终的业务逻辑(求和没问题,求平均值不可)

        提前预聚合 map端完成----->解决数据倾斜的一个方法

6:Reducer

        用户的业务逻辑

        setup初始化,reduce:用户的业务逻辑,clearup:关闭资源

7:OutputFormat

        1:默认TextOutputFormat        按行输出到文件

        2:自定义

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

总会有天明

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值