1.主要内容
介绍了gStore底层是如何存储三元组,主要是介绍了如何Encoding
2.Encoding细节
2.1 eSig.e : 边标签
让**|P|** 表示RDF图中不同属性的数量:
如果**|P|很小,就让|eSig(e).e| = |P|,那么|eSig(e).e|** 可以表示bitString 的长度,然后建立property和bit 位之间的 一对一映射
如果**|P|很大,让|eSig(e).e| = |M|**,用一个合适的hash函数将|M|中的第m位置为“1”,比如将(Hi(eLabel) MOD M)位置为1,Hi(eLabel) 为一个字符串哈希函数,即输入字符串,输出一个哈希值
2.2 eSig.n : 与边相邻的顶点
假定eSig.n的位数是N
2.2.1 nLabel 是URI
2.2.2 nLabel 是String
将字符串分解为每3个一组,将每一组带入字符串hash函数分别得到每组哈希值
然后将这些哈希值带入计算,将N的第(H(g) MOD N)位 设置为1
为了支持字符匹配
2.2.3 nLabel 是数字
为了支持范围查找
根据原文,gstore支持[0,64]位的查找,如果 nLabel
≤
\leq
≤ 32 ,在第一层时,将 [0,64]分为两部分,nLable落在第一部分,那么代码是“10”。
总之作者的思想就是,经过k层迭代,每层将[0,64]分位2k个部分,看nLables落在那个部分,落在的那个部分为“1”,其余为0.最后依次连接每层的代码即是 nLable的编码(k是用户指定的参数)
例如,如果nLables = 13 ,那么他在一层的代码是“10”,第二层为“1000”,第三层为“01000000”,第四层为“0001000000000000”