MapReduce如何开启压缩算法对结果进行压缩

最新推荐文章于 2023-05-29 21:27:24 发布

原来是小雨呀

最新推荐文章于 2023-05-29 21:27:24 发布

阅读量1.3k

点赞数 1

本文链接：https://blog.csdn.net/xiaoyuya1998/article/details/103268773

版权

注:本文使用snappy算法进行压缩内容在驱动类里面修改

方式一：在代码中进行设置压缩

设置map阶段的压缩

Configuration configuration = new Configuration();
configuration.set("mapreduce.map.output.compress","true");
configuration.set("mapreduce.map.output.compress.codec","org.apache.hadoop.io.compress.SnappyCodec");

设置reduce阶段的压缩

configuration.set("mapreduce.output.fileoutputformat.compress","true");
configuration.set("mapreduce.output.fileoutputformat.compress.type","RECORD");
configuration.set("mapreduce.output.fileoutputformat.compress.codec","org.apache.hadoop.io.compress.SnappyCodec");

方式二：配置全局的MapReduce压缩

修改**mapred-site.xml**配置文件，然后重启集群，以便对所有的mapreduce任务进行压缩
map输出数据进行压缩

<property>
          <name>mapreduce.map.output.compress</name>
          <value>true</value>
</property>
<property>
         <name>mapreduce.map.output.compress.codec</name>
         <value>org.apache.hadoop.io.compress.SnappyCodec</value>
</property>

reduce输出数据进行压缩


<property>       <name>mapreduce.output.fileoutputformat.compress</name>
       <value>true</value>
</property>
<property>         <name>mapreduce.output.fileoutputformat.compress.type</name>
        <value>RECORD</value>
</property>
 <property>        <name>mapreduce.output.fileoutputformat.compress.codec</name>
        <value>org.apache.hadoop.io.compress.SnappyCodec</value> </property>