gist索引相关

1、简单介绍

GiST(Generalized Search Tree,通用索引树)是一种平衡的、树状结构的访问方法。它在系统中相当于一个基础的模板,几乎可以使用它实现任意索引模式。B-tree、R-trees和许多其他的索引模式都可以通过GiSt实现。它可以建立一种可扩展的索引结构,包括数据类型和查询谓词的扩展。

 

gist允许用户(并非数据库专家)开发自己的数据类型,并通过相应的访问方法来在该数据类型上使用gist索引,通常,实现一种新的索引访问方法意味着大量艰苦的工作。因为必须理解数据库的内部工作机制,比如锁的机制和预写式日志。

 

gist接口提供了一个高层的抽象,只要访问方法的实现着实现被访问数据类型的语义,gist本身会处理并发、日志和搜索树结构的任务。

 

gist的源代码分布在\src\backend\access\gist目录下,包括了gist索引的创建、查找、删除等源代码

 

2、gist的扩展性

pgsql支持可以扩展的b-tree等标准搜索树,但是不要把gist的扩展性和其它标准搜索树的扩展性混同在一起,比如它们所能处理的数据类型方面。例如b-tree索引支持对多种数据类型的创建索引,但只是支持范围查询

这就是说,可以用pgsql在多种数据类型上建立b-tree。但是b-tree只支持范围谓词(=><)。所以,如果pgsql的b-tree索引一个图像集,那么就只能发出类似图像a和图像b相等嘛?或者图像a是不是比图像b小?或者图像a是否比图像b大?这样的查询。那么这些语境下的大于等于小于也许有意义也许没有意义。

而使用一个机遇gist的索引,可以创建一些方法来发出和数据类型所处领域相关的问题,比如:“找所有马的图像”或者“找出所有爆过光的图像”

 

gist可以建立一种可扩展的索引结构,包括数据类型和查询谓词的扩展。这种结构支持研发人员快速的为新的数据类型开发索引方法,其特点是在扩展数据类型的同时对谓词进行相应的扩展。

 

举例来说颜色无法绝对排序,但是可以定义这样的 red redthan blue、blue redthan green这样的谓词,在扩展数据谓词的时候增加了谓词redthan,当然数据类型也可以是一组数据如扩展成b-tree

 

3、gist的索引组织结构

gist是一颗平衡树,除根节点的子树书面在2-M之间外,每个节点的子树数目在k*M之间,常量k称作该树的最小填充因子,满足2/M<=k<=1/2,M为一个节点可以容纳索引项的最大数目。

索引项形式为(p,ptr),其中p是搜索的谓词。在叶子节点中,ptr为指向数据库中某一元组的指针;而在非叶子节点中,ptr为指向其子树节点的指针。

一个典型的gist结构如图:

在上图中,SP1、SP2(subtree predicates)是指用户分隔数据的谓词。可以看出,gist的结构和b-tree索引的结构有一定的相似性。

gist内置实现了索引项查询、插入和删除等算法。用户通过定义索引项并提供与索引项管理有关的方法,便可以实现某一特定的索引结构。这些方法包括:

1) Consistent

2) Union

3) Same

4) Penalty

5) PickSplit

6) Compress

7) Decompress

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值