MR 代码优化及Hive优化(Hive中的存储格式与压缩格式)

请百度:MapReduce的压缩优化,看看别人的博客!如:


http://www.cnblogs.com/end/archive/2013/01/15/2861448.html(非常不错!)--------》Hive优化

http://blog.csdn.net/ruidongliu/article/details/11690025---------------------------------------》MapReduce优化!

http://blog.csdn.net/wisgood/article/details/8789906---------------------------------------》MapReduce优化!



http://blog.csdn.net/erli11/article/details/40396257


http://www.cnblogs.com/zhengrunjian/p/4527269.html



在实际的项目开发当中,hive表的数据:

     存储格式:(RCfile或者Parquet,推荐使用RCfile格式)

     数据的压缩算法:snappy!


一、存储格式hive默认支持三种从存储格式,当然用户根据需要可以自定义存储格式。

存储格式优点缺点
SEQUENCEFILE压缩可分割二进制文件

需要一个合并文件的过程,

且合并后的文件将不方便查看

TEXTFILE

简单

方便查看

RCFILE

按列查找,理论上对于宽表采用这个比较好

比较新,还没有广泛应用



二、压缩格式
压缩格式工具算法文件扩展名多文件可分割性
DEFLATE*DEFLATE.deflate
GzipgzipDEFLATE.gz
ZIPzipDEFLATE.zip是,在文件范围内
bzip2bzip2bzip2.bz2
LZOlzopLZO.lzo
snappy

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值