HBase MOB简介以及使用

背景

视图数据现在发展都比较快,数据量也越来越多,数据价值也越来越大,通过数据挖掘分析,可以产生越来越多的价值。所以这种大对象的存储需求也越来越多,HBase 2.0 发布了很多新的特性,其中一个非常值得关注的是中等对象存储的特性,即 HBase MOB(Medium Object Storage)特性。HBase 2.0 MOB的引入(由HBASE-11339这个issue引入),扩宽了HBase在人工智能、物联网等领域的应用场景。

最近公司也在考虑切换对象存储策略,由之前的ceph转变为HBase MOB。所以最近我也研究了下这个特性,将一些使用心得分享给大家。

HBASE MOB

MOB对象存储

在KV存储中,一般按照KeyValue所占字节数大小进行分类:

  • KeyValue所占字节数小于1MB,这样的数据一般称为Meta数据
  • KeyValue所占字节数大于1MB,小于10MB,这样的数据称为MOB,表示中等大小的数据
  • KeyValue所占字节数大于10MB,称为LOB,大对象

对于HBase来说,存储Meta数据是最理想的场景。但是MOB存储的需求在现在的发展中也是很常见的。但是HBase存储MOB、LOB,是存在一些潜在的问题的:

  • 由于HBase所有数据都需要先写Memstore,所以少数几个MOB的cell数据就需要进行Flush操作,会造成大量的HFile,严重影响HBase的读性能
  • HDFS上的HFile文件多了后,触发LSM树会进行频繁的Compaction,消耗磁盘IO
  • 由于MOB数据的写入&#x
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
HBase是一个分布式、可扩展的开源NoSQL数据库,适用于处理大规模数据。它利用分布式文件系统Hadoop HDFS来存储数据,并提供高可靠性和容错性。 HBase MOB(Medium Object)是HBase的一个特性,用于存储较大的对象,如PDF文件。它通过对大对象进行切分和存储,提供了高效的存储、检索和管理能力。 HBase MOB提供了以下特性和优势: 1. 快速检索:HBase MOB使用索引来加快大对象的检索速度,可以通过行键或时间戳进行快速的查找。 2. 高效存储:HBase MOB通过切分大对象,并将其存储在单独的存储文件中,以减小存储开销。同时,可以进行压缩和编码,进一步减小存储空间。 3. 数据一致性:HBase MOB通过使用WAL(Write-Ahead Log)和HLog(HBase日志)保证数据的一致性和持久性。 4. 生命周期管理:HBase MOB可以根据设定的时间范围自动清理过时的数据,以节省存储空间。 5. 安全性:HBase MOB提供数据的安全性和权限控制,可以限制用户对MOB对象的访问和修改。 在使用HBase MOB存储PDF文件时,可以将PDF文件拆分为较小的块,并存储在HBase中。可以根据需要检索和管理PDF文件。 综上所述,HBase MOBHBase的一个扩展功能,适用于存储和管理较大的对象,如PDF文件。它提供了高效的存储、检索和管理能力,可以根据需要进行配置和调整,满足不同场景下的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值