了解更多Greenplum技术干货,欢迎访问Greenplum中文社区网站
引言
Greenplum是一款强大而稳定的企业级分布式数据库。虽然基于 PostgreSQL,但Greenplum针对大数据的场景和用户对性能的极致追求开发了大量的特性和做了极致甚至苛刻的优化。此外,Greenplum紧密拥抱Postgres社区,以敏捷的方式快速升级Postgres内核。在Postgres 9.5的内核中,Postgres引入了一种全新的索引类型,名为Brin Index,本文将详细介绍Brin Index的内部实现以及性能表现。
01 什么是Brin Index
Brin全称Block Range Indexes,顾名思义即数据块范围的索引,它的设计初衷是为了解决当数据表极其庞大时的迅速扫描问题。
众所周知,Heap表以页面为单位进行组织,所以表的扫描也是以页面为单位。Brin索引的基本思想就是在索引中记录一组连续页面中字段值的大致统计信息,例如连续页面里某字段的最大值和最小值,页面扫描的时候根据Brin统计信息和查询条件直接跳过明显不符合查询条件的页面,从而达到快速扫描的效果。
在实际的查询计划中,位图扫描基于Brin索引完成整个扫描过程,如下所示:
gpadmin=# explain select * from t1 where c1 > 10 and c1 < 100;
-----