hbase数据压缩

使用了一段时间之后发现hbse的空间不足,需要对hbase进行数据压缩
hbase支持的压缩格式:GZ(GZIP),LZ0,LZ4,Snappy

compact分为两类,一类叫Minor compact ,一类叫Major compact;
两者的区别在于:Minor compact只是进行文件merge操作,而Major compact除了做文件Merge操作,还会将其中的delete项删除

1.建表的时指定数据压缩格式
# 创建指定压缩格式的表
create 'ods:tablename',{NAME=>'info',COMPRESSION=>'Snappy'},{NAME=>'f2'}
# 查看建表信息
desc 'ods:tablename'

# 删除表
disable 'ods:tablename'
drop 'ods:tablename'

在这里插入图片描述

2.对已有的表的数据进行压缩
# 新建未压缩表
create 'ods:tablename',{NAME=>'info'}
# 查看表信息
desc  'ods:tablename'

在这里插入图片描述

# 禁用表
disable 'ods:tablename'
# 修改info列族的压缩格式
alter 'ods:tablename' ,{NAME=>'info',COMPRESSION=>'Snappy'}
# 启用表
enable 'ods:tablename'
# 查看表信息
desc 'ods:tablename'

在这里插入图片描述

tips
GZ:用于冷数据压缩,与Snappy和LZ0相比,GZIP的压缩率更高,但是更消耗CPU,解压/压缩速度更慢。

Snappy和LZ0:用于热数据压缩,占用CPU少,解压/压缩速度比GZ快,但是压缩率不如GZ高。

Snappy与LZ0相比,Snappy整体性能优于LZ0,Snappy压缩率比LZ0更低,但是解压/压缩速度更快。

LZ4与LZ0相比,LZ4的压缩率和LZ0的压缩率相差不多,但是LZ4的解压/压缩速度更快。

多数情况下,选择Snppy或LZ0是比较好的选择,因为它们的压缩开销底,能节省空间。

参考:
https://blog.51cto.com/mjal01/1963644
https://www.cnblogs.com/cxzdy/p/5368715.html

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cocktail_py

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值