笔者看到一篇文章对IR树
的总结,这里摘录一下。
原文章来自X. Cao, G. Cong, C. S. Jensen, and B. C. Ooi. Collective spatial keyword querying. In SIGMOD, pages 373–384. ACM, 2011.
3 预备知识部分
IR树[8]
本质上是一个R树[12]
使用倒置文件 [16]
进行扩展。
IR 树中的每个叶节点都包含以下形式的条目(o, o.λ, o.di)
,其中 o 是数据集 D 中的对象,o.λ 是 o 的边界矩形,o.di 是 o 描述的标识符。
每个叶节点还包含一个指向倒置文件(翻译的不好,建议去看下原文 Inverted file)的指针,倒置文件中包含节点中存储的对象的关键字。
一个倒置文件索引有两个主要的成分:
- 出现在对象描述中的所有不同单词的词汇表。
- 每个单词 t 的过帐列表,该列表是其描述包含 t 的对象的标识符序列。
IR 树中的每个非叶节点 R 都包含许多形式(cp、rect、cp.di)的条目,其中 cp 是 R 的子节点的地址,rect 是子节点条目中所有矩形的最小边界矩形 (MBR),cp.di 是伪文本描述的标识符,它是子节点条目中所有文本描述的并集。
例如,图 1(a) 包含八个空间对象 o1, o2, . . . , o8,图 1(b) 显示了每个对象。
图 2 显示了相应的 IR 树
表 1 显示了与节点关联的倒置文件的内容。