什么是索引
数据库查询时,如果对某个属性值进行查询,需要遍历整个表,才能得到想要的结果,如果每次查询这个属性都这样遍历一遍,那就太影响效率了,所以为了方便数据库查询,对于经常查询的表中的一列或多列的值进行排序,得到的结果存储在一种结构中,这个结构在数据库进行这个经常的查询操作时,就可以直接定位到相关位置,获取数据,这样就不需要遍历所有的行了,而这个结构就是索引,简单来说,索引就是指向表中数据的指针。。
索引的存储结构
索引主要可以采用B+树或HashTable实现,主流的数据库引擎大都采用B+树的结构。
1、HashTable结构
当对表中某一列或多个列的查找操作添加索引时,可以对这张表每一行进行hash计算,得到的Hash值,按照hash值排序在一个数组上。
- hashtable的方法可以实现一次定位,就可以得到想要查的值。
- 由于hashtable中是按照hash值进行排序的,所以不能用于范围查询或者排序操作。
2、 B+树结构
同样,采用B+树的结构存储索引时,数据按照顺序存储在B+树的叶子节点上,当进行查询操作时,按照B+树的结构一步步找到数据的位置,IO操作的次数与树的高度有关。
索引的优点和缺点
- 优点:加快数据的查询速度,加速表与表之间的连接。
- 缺点:创建索引需要增加空间的占用,对表中数据进行更新删除或者添加操作时,也需要对索引进行维护。
虽然索引可以加快查询速度,但是不能对每个表都添加索引,添加索引的条件一般为经常查询的表。
创建索引,下面情况不适合建立索引:
- 表记录太少
- 经常插入、删除或更新的表
- 数据重复且分布均匀的表