关系型数据库中的索引

说白了索引就是一个查找问题

索引是对数据库表中的一列或者说是多列进行排序的一种结构,使用索引可以快速访问数据库表中的特定信息。索引的一个主要目的就是加快检索表中数据的方法

例子:这样一个查询语句selecr * from table1 where id=1000;
如果没有索引的话,必须遍历整个表,知道id等于10000的这一行被找到为止。但是有了索引之后(必须在id这一列上建立索引),即可在索引中查找,由于索引是经过某种算法优化过的,因为查找次数要少的多。可见索引是用定位的O(logN)。

数据库索引的数据结构基础:B+tree

数据库索引是用于提高数据库表的数据访问速度

a)、索引的目的是什么?

1 能够避免全表扫描(如:数据表中有1000条数据,我们只需要根据条件查询其中的一条,针对该列创建一个索引只需要扫描这一条即可如果不创建索引我们得扫描1000条
2 让服务器快速定位到表的位置提高检索速度
3 帮助服务器避免排序和临时表的生成
将随机 I/O 变成 顺序 I/O
5 创建唯一性索引,保证数据库表中每一行数据的唯一性
加速表和表之间的连接
7 使用分组排序子句进行数据检索时,可以显著减少查询中分组和排序的时间

b)、索引对数据库系统的负面影响是什么?

创建索引和维护索引需要耗费时间,这个时间随着数据量的增加而增加
2 索引需要占用物理空间,不光是表需要占用数据空间,每个索引也需要占用物理空间
3 当对表进行增、删、改的时候,索引也要动态维护这样就降低了数据的维护速度

c)、MySQL索引的创建原则(在哪些列上,以怎样的方式,创建索引更好)

1 在经常需要搜索的列上,可以加快搜索的速度

2 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度

3 在经常需要排序的列上创建索引因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

选择性最高的列(选择性=不重复的索引值/总记录)

对字符串进行索引,保证选择性较高前缀不能太长,即前缀的基数应接近完整列的基数可以节省大量的索引空间后缀索引:字段值反向存储;(注意:平均选择性高,数据分布不均,陷阱)

6 根据情况创建复合索引,复合索引可以提高查询效率;

避免创建过多索引索引会额外占用磁盘空间降低写操作效率

8 主键尽可能选择较短的数据类型(如:int/bigint),可以有效减少索引的磁盘占用提高查询效率

d)、 不应该在这些列上建立索引?

1 对于那些在查询中很少使用或者参考的列不应该创建索引,这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求
当修改性能远远大于检索性能时,不应该创建索引,这是因为修改功能和检索功能是互相矛盾的

如何在使用SQL创建索引:

之前的例子中,在Employee_Name列上创建索引的SQL如下:

CREATE INDEX name_index
ON Employee (Employee_Name)

如何创建联合索引

我们可以在雇员表上创建两个列的联合索引,SQL如下:

CREATE INDEX name_index
ON Employee (Employee_Name, Employee_Age)

索引的类型

索引有很多种类型,都是实现在存储引擎层的

1 普通索引:最基本的索引,没有任何约束限制。
2 唯一索引:与普通索引类似,但是 具有唯一性约束。
3 主键索引:特殊的唯一索引,不允许有空值。
4 组合索引:将多个列组合在一起创建,可以覆盖多个列。
5 外键索引:只有 InnoDB类型的表才可以使用外键索引,保证数据的一致性、完整性和实现级联操作。【基本上不使用】
6 全文索引:MySQL自带的全文索引只能用于 MyISAM,并且只能对英文进行全文检索。【基本上不使用】
7 B+树索引
8 哈希索引
9 空间数据索引(R-Tree)

  • MyISAM存储引擎
  • 用作地理数据存储
  • 无须前缀查询
  • 从所有维度索引数据
  • 使用任意维度来组合查询
  • B+Tree的不同
    可使用所有维度来索引数据,而无需最左前缀原则

MySQL索引的注意事项

① 复合索引遵循前缀原则;

// 创建一个索引
KEY(a, b, c); 

// 以下3种情况该索引生效:
WHERE a=1 and b=2 and c=3;
WHERE a=1 and b=2;
WHERE a=1

// 以下2情况该索引不生效:
WHERE b=2 and c=3; // 因为跳过了a
WHERE a=1 and c=3; // 因为跳过了b

常考题:

  • 题目:我创建了一个 WHERE a=1 and b=2 或者 WHERE a=1这样的查询,我需要创建一个什么样的索引比较合适?
  • 答案:KEY(a, b);

注:KEY(a, b,c) 表示 创建了一个索引,同时作用于a,b,c,目的是为了缩短查询范围(如:创建一个组合索引,章节段,查询第几章中的第几节的第几段,这样缩短了查询的范围)。

② like 查询,% 不能放前,可以使用全文索引;

where name like "%wang%"; // 不要使用该方法

③ column is null 可以使用索引;

④ 如果MySQL估计使用索引比全表扫描更慢,会放弃使用索引;

假设表中有100条数据,在写条件的时候这样写

where id > 1 and id < 100 

即使对 ID设置了索引,在搜索的时候,搜索的是 2~99 之间的数据。

搜索过程:首先找 2 这条数据,去索引中看看它在什么位置,找到索引后,再去定位数据行;然后再去看 3, 再去看索引,再去找数据行,;再去看 4,再去看索引,再去找数据行,… ,一直到 99 都要这样去操作。

所以在这里面本身来说,我们这样来查询,首先我们会多一个查询索引的步骤,所以MySQL认为,本身就100条数据,要查询其中的98条数据,而这98条数据都需要去看索引,所以就很慢,直接把这100条数据都扫描一遍,然后返回其中的98条 不就可以了么,这样效率会更高,它会自动去放弃,不需要我们手动放弃,这是我们优化器做的事

⑤ 如果 or 前的条件中的列有索引,后面的没有,索引都不会被用到; 老版本不合并,5.0及以上版本合并

where a or b; // 如果a中有索引,b中没有索引,该索引就会失效

⑥ 列类型是字符串类型,查询时一定要给值加引号否则索引失效

// 在创建的时候设置了 name varchar(16)
// 搜索的时候,name为100
where name = 100; // 写成这样的形式,可以搜索到,但是没有用到索引【因为本身是字符串类型,而写成了整型】
where name = "100"; // 此时才用到了索引【一定要给值加引号】

创建 MySQL复合索引(组合索引) 应该注意哪些事项?

  • 遵循前缀原则
  • 看查询条件(如果查询条件中是 WHERE a=1 AND b=2 我们可以创建一个 KEY(a,b) 这样的复合索引 ,如果搜索 WHERE a=1 时,该索引也可以被使用到)。

https://blog.csdn.net/csdnlijingran/article/details/88607333

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值