背景
HBase在处理billion级别的能力是毫无质疑的,目前优于其他的nosql数据库,如mongodb、cassandra、redis等, 配合它强大的rowkey查询,fileter,协处理器等,在海量数据库中发挥了强大的功能。但是HBase因为满足的是CAP原则中C和P,所以在查询过程中语句支持较弱,使用过程较为复杂。存在下面的一些痛点。
痛点
- 首先HBase只能存储byte数组的数据,数据存入到hbase中时都需要做相应的转换,读取的数据的时候也要相应的转换回来,使用麻烦。
- 第二,HBase在使用过程中,涉及到filter、协处理的使用,如果对API不熟悉,无法下手。
- 第三,hbase本身不提供分页的功能,每次分页需要在代码中记录当前读取的rowkey,在使用PageFilter读取一定数量的rowkey,然后继续读取,编程复杂度高。
- 最后,不熟悉hbase的开发人员,无法理解nosql、hbase的no schema,期望还是用关系数据库的方式操作hbase。
HBase ORM框架
基于以上的原因,所以我有了想写一个类似于hibernate那种对象关系映射框架(ORM)的想法,像操作对象一样方便的操作HBase数据库,但是它要是轻量级的,无侵入的,只提供CURD、分页、映射功能的一个简单功能。
一些特性:
- 使用注解的方式,将PO(Persistent Object)映射成HBase对应的表
- 提供CRUD的方法:create\research\update\delete
- 提供分页查询的功能
- 提供类似于hibernate中Criteria 风格的操作方式
Demo:
1、在po对象上添加相应的注解:@Table\@RowKey\@Column
@Table(name =