基于hbase mapreduce和coprocessor实现hbase二级索引创建与自动维护
设计思路:
每个索引建立一个索引表(表名由用户自定义相当于oracle中的索引名,)索引表一个列族“IDX”,一个字段“IDX:V”,rowkey有索引列值拼装而成,“IDX:V”由索引行的rowkey拼装而成。
例子:
“Rowkey”:2013-04-014982332782
“IDX:V”:319999572,320077775,320165209,320077774,319999571,320077773,319999573
另外建立一个表存放表-索引关系,表名为table_index,结构如下:
rowkey,r:cf,r:cl,r:idx,r:tab
Rowkey:由表名和索引名拼装,如aaa_idx_aaa;
R:cf:索引的列族名
R:cl:索引的列名
R:idx:索引表的名称
R:tab:原表名称
提供一个类供用户调用以创建初始化索引表并在该表注册索引自动更新的coprocessor。
类名:IndexBuilder
参数:字符串数据
arg[0]:需要创建索引的表名
arg[1]:需要创建索引的列族名
arg[2]:需要创建索引的列名,复合索引的列名间用逗号分隔,不要带列族名
arg[3]:自定义的索引表名(不要跟现有表名冲突)
arg[4]:是否执行创建索引的mapreduce程序,“true”为执行,“false”为不执行
定义一个coprocessor拦截用户的put、delete操作实现索引的自动更新