Hadoop MapReduce 压缩优化

compress压缩优化:大大减少磁盘IO以及网络IO

MapReduce有很多地方都可以压缩

Hadoop常见的压缩格式
检查本地库支持哪些压缩:

bin/hadoop checknative

修改压缩库,只需要替换native包即可
常用用的压缩格式:snappy;lzo;lz4

hadoop中设置压缩
原理:map的中间结果:

mapreduce.map.output.compress = true;
 
maprduce.map.output.compress.codec=org.apache.hadoop.io.compress.Lz4Codec

压缩方式的寻找:DefaultCodec -》找打该类的目录-》其他压缩类和他在同一个目录下!

配置方式:
方式一:main方法中Configuration

在这里插入图片描述

方式二:在配置文件中
   全局修改,所有MapReduce都生效
方式三:运行的时候通过自定义配置
  bin/yarn jar 运行jar包.jar -D压缩属性=yy -D压缩属性=bb 运行主类 input_path(输入目录) output_Path(输出目录)
检查是否配置成功
方式一:

web中8088端口 -》history -》Configuration-》查看对应配置参数

方式二:查看计数器,Linux中的结果输出信息
 Map output materialized bytes
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值