GBase 8t索引

        索引是在数据库中提高数据查询处理性能的一个非常关键的技术,索引的使用可以对性能产生上百倍甚至上千倍的影响。

索引的基本概念

        索引是用来快速查询表记录的一种存储结构。一般使用索引有一下两个方面。

1.确定记录的唯一性

        通过创建唯一性索引来保证表中记录的唯一性要求.

2.提高数据查询的性能

        提高表记录的查询性能是索引存在的最大优点。在没有索引的情况下。数据库优化器需要采取顺序扫描的方式扫描全表来查找目标记录。具体做法是,读取所有属于该表的数据页,从表的第一个数据页开始,顺序访问所有包含该表的设备,知道最后一页为止。返回满足条件的所有行。在扫描小表的记录和需要查找大表中大多数记录的情况下,顺序扫描是一种不错的选择,小表只占有很少的数据页,对于小表的顺序扫描需要的I/O非常小。对于在大表中进行全表扫描的情况,如数据仓库中对系统报表进行查询统计时,需要利用全表数据进行max、min、avg、sum等包含聚集函数的查询,此时整个表的数据都是查询结果所需要的,这使得顺序扫描优于随机扫描。

        但是,顺序扫描在OLTP系统中性能太低,OLTP系统的特点是一个事务需要处理的记录数非常小,但是表中的记录量非常大。若要在大表中寻找满足一定条件的少量记录(比如<=5%),那么顺序扫描需要大量的I/O动作,同时消耗大量的内存,把不需要的数据页填充到内存缓冲区中,影响buffer的使用进而影响整个数据库的性能。因此我们不应该使用顺序扫描的方式去访问随机的或者非顺序存储的数据,这会导致非常明显的性能损失。那么在这种情况下,数据库通过查询索引中记录的行数据所在物理位置的信息,就可以快速读取满足条件的少量记录行,而不需要将整个表记录都读取到内存中,因此索引可以有效地减少I/O。

        当两表进行关联连接且其中一张表很大时,索引也是必要存在的。在没有索引的情况下,两张表进行关联时,嵌套循环的迭代连接过程将严重影响表关联性的性能。此时需要将第一张表中每条满足条件的记录逐一与第二张表进行全表记录匹配,如果第二张表非常大,则全表扫描的方式将大大影响表关联的效率。在有索引的情况下,优化器可以通过索引找到目标记录,大大减少匹配次数。当然实际的数据库优化器会对没有索引的表实时创建Hash索引,采用Hash join方式进行关联。

        索引是数据库中的一种结构或者对象,数据库索引与书或文件柜的索引非常像。它以记录的特征(通常是一个或多个字段的值)作为输入,能够快速找出具有该特征的记录,为查询提供了快速访问符合条件的数据行能力。利用索引进行随机访问时,能够最小化I/O,显著提高性能。数据库中的索引是一种动态的数据结构,它会和表中的数据一起改变。在一个表中可以有多个索引,用来满足不同查询的需要。

在下列几种情况下,数据库优化器可以使用索引对查询进行加速:

(1)使用随机访问方式替代全表数据的顺序访问时;

(2)查询表达式中只有索引列时,可以避免读取表中的其他数据行;

(3)在执行GROUP BY和ORDER BY子句时,避免不必要的排序的操作(包括创建临时表)。通常,数据库优化器决定是否需要使用索引,当然我们也可以强迫优化器使用或者避免使用索引。

在执行查询前,如果恰当地在列上建立了索引,则可以节省上千次、上万次,在极限情况下甚至节省上万次的磁盘I/O。但是索引也需要占用空间和资源,来进行额外的处理和索引维护工作。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

八珍豆腐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值