数据库中的索引与树

最新推荐文章于 2024-05-10 10:34:19 发布

zz信

最新推荐文章于 2024-05-10 10:34:19 发布

阅读量414

点赞数 6

文章标签：数据库 java 数据结构

本文链接：https://blog.csdn.net/z1916429113/article/details/126960547

版权

索引 – Index

什么是索引
索引是作用于列上,用于对该列的值进行排序,形成一个目录,从而提高该字段的查询效率的,索引适用于数据量大的表中.
索引底层是B+Tree
B+Tree是基于BTree
BTree数据结构 – B:balance 平衡
BTree的特点:
1. 以数据块来保存元素,实现排序
2. 每个数据块中最多保存degree-1个元素,当数据块中的元素数量达到度的值时,此时会进行分裂提取,将最中间的元素提取到上一级数据块中,将原数据块分裂成左右两个数据块
3. 查询优势:每次比较会排除大量数据,无需读取这些数据,整体而言,树的高度是几,则读取几次数据块,查询次数会大大降低,查询效率会提高.

B+Tree和BTree的区别

叶子数据块之间用单向链表进行连接,为了提高区域范围内的数据查询效率
在叶子数据块进行分裂提取时,提取出去的元素依然存在于原叶子数据块中;但是若从非叶子数据块进行分裂提取,此时提取的数据不会再存在于原数据块中.保证最终查询的数据一定位于叶子数据块中.非叶子数据块存在的意义是作为目录存在.

查询效率高: 整体查询的次数降低了,不会对所有元素都查询,而是每次比较之后,可以排除大量数据

树-- Tree
专业术语:

根节点:每棵树中有且仅有一个根节点
高度: 树的层次数
度:树中所有节点的最大子节点数
叶子节点:度为0的节点

索引的高度固定为3,则度会根据数据量进行适当的调整
注意:将读取到的数据块缓存到内存上后 ,对内存中缓存的数据块中的数据进行读取,采用的是二分查找算法
索引的底层是B+Tree,但是索引对B+Tree进行了一些优化

索引使用B+Tree,在叶子数据块中保存的元素不是一个元素值,而是key-value
则索引中叶子数据块中的key-value分别保存什么?
索引的分类
1. 聚簇索引(聚集索引):给主键id添加的索引就叫做聚簇索引
2. 非聚簇索引(非聚集索引):给非主键字段添加的索引叫做非聚簇索引
Innodb的特点
从mysql5.5开始存储引擎换为Innodb,该存储引擎有以下的特点:
1. Innodb支持事务和行锁
2. 默认会给表的主键添加聚簇索引;若表中没有提供主键,此时Innodb会自动给表添加隐藏主键,类型为long,长度为6,Innodb会给该主键添加聚簇索引
3. 除聚簇索引外,Innodb默认还会给添加了unique约束以及外键约束的字段添加索引.
聚簇索引
聚簇索引是Innodb存储引擎默认添加的.无需我们添加
聚簇索引中的key和value分别保存什么?
key: 主键-id
value: 主键对应的行数据

聚簇索引中,根据id就可以直接找到对应的行数据
非聚簇索引
是需要我们添加的,其key和value分别为:
key:保存添加了索引的那列的值
value: 这行数据对应的id(主键)

非聚簇索引中,根据添加了索引的那列的值,可以快速的找到对应的id,此时再根据id到聚簇索引中,可以快速查询到对应的行数据,这个操作叫做回表操作.
索引操作
1. 创建索引
  create index index_name on table_name(col)
  案例: 给字段添加unique约束,验证是否Innodb默认给添加了索引
  添加unique约束:
  alter table t_name add col type unique;
  create table t_name(id int primary key,name varchar(20) unique)
2. 查询索引
  show index from table_name
3. 删除索引
  drop index index_name on table_name
索引的适用场景
1. 表中的数据量大时,应该使用索引.表中数据量不大,不要使用索引,因为建立索引也是需要时间的.
2. 通常会给作为查询条件的字段添加索引
3. 当某字段的值会被频繁修改时,不要给该字段添加索引,因为每次修改都会改变元素的排序,从而导致索引重构,耗费时间
4. 在一个表中,索引并不是越多越好,通常情况下,一个表中的索引不要超过6个
索引的失效场景
索引失效是指：因为一些不当操作，导致进行全表扫描，而不使用索引，这种情况我们叫做索引失效。

使用索引时sql语句要避免的情况：
1.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描
where name is not null /is null
2.应尽量避免在 where 子句中使用!=操作符，否则将引擎放弃使用索引而进行全表扫描
3.应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描
where name=xx or age=xx or col=xx 若其中一个字段没有索引,其他有索引的字段也不会走索引
4.not in 也要慎用，否则会导致全表扫描，in并不会导致索引失效
where …not in(xx,xx,xx)
适用in 会不会适用索引? – 会
5.尽量避免在where子句中对字段使用like左侧模糊查询(like ‘_%’)，会导致全表扫描
where xx like ‘%xx’ /like ‘_x’
6.应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描
eg: select…from user where age+4>12
7.应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描
eg：select…from …where round(score)=…

使用索引注意事项：
索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。

数据库的五大约束

主键约束 – 要求数据非空且唯一
唯一性约束 – unique 要求数据唯一
外键约束 – foreign key 特点: 若主键的值正在作为外键被使用,则不能删除该条数据
非空约束 – not null 要求数据不能为空
检查约束 – check(age between 18 and 20) 要求插入的数据中的age必须在18-20之间