基于Cloudera Manager5.7配置MapReduce与HiveOnSpark压缩
1、Yarn配置MapReduce的输压缩
1) 输出采用gzip压缩
2)中间结果的计算采用snappy的压缩
2、HiveOnSpark的压缩配置
1) hive结果的输出采用gzip
2) spark中间计算默认采用的是snappy压缩
基于Cloudera Manager5.7配置MapReduce与HiveOnSpark压缩
1、Yarn配置MapReduce的输压缩
1) 输出采用gzip压缩
2)中间结果的计算采用snappy的压缩
2、HiveOnSpark的压缩配置
1) hive结果的输出采用gzip
2) spark中间计算默认采用的是snappy压缩