索引的数据结构与优缺点

1、索引的数据结构
什么是索引?
索引就是mysql为了提高查询数据的一种数据结构。在数据之外,数据库系统还维护着满足特定查找算法
的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找
算法,这种数据结构就是索引
在这里插入图片描述
2、索引的优缺点
(1)优点
1) 类似于书籍的目录索引,提高数据检索的效率,降低数据库的I0成本。
2)通过索弓|列对数据进行排序,降低数据排序的成本,降低CPU的消耗。
(2)缺点
1) 实际上索引也是一张表,该表中保存了主键与索引字段,并指向表的记录,所以索弓|列也是要占
用空间的。
2)虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、
DELETE。因为更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了 索引列的
字段,都会调整因为更新所带来的键值变化后的索引信息。
3、索引的数据结构是什么?
大多数采用B+TREE树,少数使用Hash表。

了解B-(B)TREE
B树是一种多路平衡查找树,它的每一个节点最多包含k个孩子,k 被称为B树的阶。k的大小取决于磁盘页的大小。
下面来具体介绍一下B- 树(Balance Tree) ,一个m阶的B树具有如下几个特征: .
1.根结点至少有两个子女。
2.每个中间节点都包含k- 1个元素和k个孩子,其中m/2 <= k <= m
3.每一个叶子节点都包含k-1个元素,其中m/2 <= k <= m
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列,节点当中k- 1个元素正好是k个孩子包含的元素的值域分划。

带有卫星数据的B-树(图摘自知乎程序员小灰)

总结:二叉树每个节点只存储一一个元素,而BTree每个节点可以存储k-1个元素。而k的取值取决于阶的
个数。[m/2<=k<=m] .由于Btree每个节点中存储的元素个数更多,导致了相同元素经过IO的次数更
少,从而效率更高了。

然后是B+树
一个m阶的B+树具有如下几个特征:
1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索
引,所有数据都保存在叶子节点。
2.所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关
键字的大小自小而大顺序链接。
3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。
帶有衛星數據的B+樹(图摘自知乎程序员小灰)

B树和B+树有两点不同。首先,B+ 树的中间节点没有卫星数据,所以同样大小的磁盘页可以容纳更多的节点元素。其次,B+ 树的查询必须最终查找到叶子节点,而B-树只要找到匹配元素即可,无论匹配元素处于中间节点还是叶子节点。因此,B-树的查找性能并不稳定(最好情况是只查根节点,最坏情况是查到叶子节点)。而B+树的每一次查找都是稳定的。
综合起来,B+树相比B-树的优势有三个:

  1. I0次数更少;
  2. 查询性能稳定;
  3. 范围查询简便。

卫星数据的存储:
数据库的聚集索引(Clustered Index)中,叶子节点直接包含卫星数据。
在非聚集索引(NonClustered Index)中,叶子节点带有指向卫星数据的指针。

4、索引的分类

  1. 单列索引:即一个索引只包含单个列,一个表可以有多个单列索引
  2. 唯一索引:索引列的值必须唯一, 但允许有空值,[primary unique]
  3. 复合索引:即一个索引包含多个列

5、如何创建索引

create index 索引名 on 表名
show index from 表名
drop index 索引名 on 表名

6、创建索引的原则
●对查询频次较高,且数据量比较大的表建立索引。
●索引字段的选择,最佳候选列应当从where子句的条件中提取。
●使用唯一 索引,区分度越高,使用索引|的效率越高。身份证手机号账号。
●索引可以有效的提升查询数据的效率,但索引数量不是多多益善,索引越多,维护索引的代价自然也就水涨船高。对于插入、更新、删除等DML操作比较频繁的表来说,索引过多,会引入相当高的维护代价,降低DML操作的效率,增加相应操作的时间消耗。另外索引过多的话,MySQL也会犯选择困难病,虽然最终仍然会找到一个可用的索引,但无疑提高了选择的代价。
●使用短索引,索引创建之后也是使用硬盘来存储的,因此提升索引|访问的I/O效率,也可以提升总体的访问效率。假如构成索引的字段总长度比较短,那么在给定大小的存储块内可以存储更多的索引值,相应的可以有效的提升MySQL访问索引的I/O效率。
●利用最左前缀法则,N个列组合而成的组合索引,那么相当于是创建了N个索引,如果查询时
where子句中使用了组成该索引的前几个字段,那么这条查询SQL可以利用组合索引来提升查询效
率。

7、存储过程
存储过程和函数是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程和函数
可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,对于提高数据
处理的效率是有好处的。
存储过程和函数的区别在于函数必须有返回值,而存储过程没有。
函数:是一个有返回值的过程;
过程:是一个没有返回值的函数;

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值