最近使用到hbase做存储,发现使用scan的时候,返回的rowkey并不是特别友好
例如我insert的rowkey是 xyz_123_abc
调用KeyValue的getKeyString方法返回的String为
- kv\x00\x0Bxyz_123_abc\x02kvobj\x00\x00\x011\xD7\xB9\xDD\x1B\x04
可以看到我的rowkey已经被处理过了,不过这个处理只是拼接处理,没有其他译码的过程。
好吧,这下需要考虑如何提取出我的真实的rowkey了,看了下KeyValue中,生成key的算法太繁琐了,直接跳过,debug看下rowkey的返回过程,发现KeyValue对象本身其实是正常的,也就是说KeyValue的toString方法其实有正常的rowkey,ok找到入口点了,直接看toString的方法
- public String toString() {
- if ( this .bytes == null || this .bytes.length == 0 ) {
- return "empty" ;
- }
- return keyToString( this .bytes, this .offset + ROW_OFFSET, getKeyLength()) +
- "/vlen=" + getValueLength();
- }
接着看keyToString方法,摘取最前面重要的2段
- public static String keyToString( final byte [] b, final int o, final int l) {
- if (b == null ) return "" ;
- int rowlength = Bytes.toShort(b, o);
- String row = Bytes.toStringBinary(b, o + Bytes.SIZEOF_SHORT, rowlength);
这次终于找到了他的构成方法了,ok 对照KeyValue的API 可以写个util方法来获取真实的rowkey字符串了
- public static String getRealRowKey(KeyValue kv) {
- int rowlength = Bytes.toShort(kv.getBuffer(), kv.getOffset()+KeyValue.ROW_OFFSET);
- String rowKey = Bytes.toStringBinary(kv.getBuffer(), kv.getOffset()+KeyValue.ROW_OFFSET + Bytes.SIZEOF_SHORT, rowlength);
- return rowKey;
- }
更多信息请查看 java进阶网 http://www.javady.com