hadoop中4中常用的压缩格式的特征的比较

1 gzip压缩 优点:压缩率比较高,而且压缩/解压速度也比较快;hadoop本身支持,在应用中处理gzip格式的文件就和直接处理文本一样;有hadoop native库;大部分linux系统都自带gzip命令,使用方便。 缺点:不支持split。 应用场景:当每个文件压缩之后在130M以内...

2016-12-12 09:22:55

阅读数 395

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭