MySQL —— 索引

概念

索引是通过某种算法,构建出一个数据模型,用于快速找出在某个列中有一特定值的行,不适用索引,MySQL必须从第一条记录开始读完整个表,直到找出相关的行,表越大,查询数据所花费的时间就越多,如果表中查询的列有一个索引,MySQL能够快速到达一个位置去搜索数据文件,而不必查看所有数据,那么将会节省很大一部分时间。
可以理解为索引类似一本书的目录,比如要查找‘student’这个单词,可以先找到s开头的页,然后向后查找,这个就类似索引

索引分类

索引是存储引擎用来快速查找记录的一种数据结构,按照实现的方式分类,主要分为Hash索引和B+Tree索引;
按照功能划分,索引有以下分类:

  • 单列索引:普通索引;唯一索引;主键索引
  • 组合索引
  • 全文索引
  • 空间索引

单例索引

单例索引:一个索引只包含单个列,但一个表中可以有多个单列索引

1 普通索引

普通索引:MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和空值,纯粹为了查询数据更快一点
创建:

#方式1 创建表的时候直接指定
create table student(
	sid int primary key,
	card_id varchar(20),
	name varchar(20),
	index index_name(name) --给name列创建普通索引
);
#方式2 直接创建
create index index_name on student(name);
#方式3 修改表结构添加索引
alter table student add index index_name(name);
#查看数据库所有索引
select * from mysql.innodb_index_stats a where a.database_name = '数据库名';
#查看表中所有索引
select index from 表名;

删除:

drop index 索引名 on 表名
#或
alter table 表名 drop index 索引名

2 唯一索引

唯一索引与普通索引类似,不同的就是:唯一索引列的值必须唯一,但允许有空值,如果是组合索引,则列值得组合必须唯一
创建:

#方式1 创建表的时候直接指定
create table student(
	sid int primary key,
	card_id varchar(20),
	name varchar(20),
	unique index_card_id(card_id) --给name列创建索引
);
#方式2 直接创建
create unique index index_card_id on student(card_id);
#方式3 修改表结构添加索引
alter table student add unique index_card_id(card_id);

删除:

drop index 索引名 on 表名
#或
alter table 表名 drop index 索引名

3 主键索引

每张表一般都会有自己的主键,当我们在创建表时,MySQL会自动在主键列上建立一个索引,这就是主键索引。主键是具有唯一性并且不允许为null,所以他是一种特殊的唯一索引
主键索引的创建就是为表添加主键

组合索引

组合索引也叫复合索引,指的是我们在建立索引的时候使用多个字段,例如同时使用身份证和手机号建立索引,同样的可以建立为普通索引或者是唯一索引,复合索引使用复合最左原则
创建:

create unique index|index index_name on table_name(column1(length),column2(length)...);

删除:

drop index 索引名 on 表名
#或
alter table 表名 drop index 索引名

最左原则实例说明:

#创建普通组合索引
create index index_card_id_name on student(card_id,name);
select * from student where name = '张三'; --此查询不会用到索引,因为在使用组合索引时,字段必须按照创建时的顺序使用,创建时第一个字段是card_id,第二个是name,不能跳过card_id直接使用name
select * from student where card_id = '001'; --此查询可以使用索引
select * from student where card_id = '001' and name = '张三'; --此查询可以使用索引
select * from student where name = '张三' and card_id = '001'; --此查询可以使用索引,这里虽然where条件后的字段顺序和创建时设定的字段顺序不一致,但两个条件使用的是and关键字,MySQL本身有一层SQL优化,它会根据sql来识别该用哪个索引,可以理解为该查询和上一个查询在MySQL眼中是等价的;但如果使用or来连接条件,则必须按照创建索引时设定的字段顺序来使用

全文索引

  • 全文索引的关键字是fulltext,全文索引是用来查找文本中的关键字,而不是直接与索引中的值相比较,它更像是一个搜索引擎,基于相似度的查询,而不是简单的where语句的参数匹配
  • 用like+“%”就可以实现模糊匹配了,为什么还要使用全文索引呢?是因为like+“%”在文本比较少时是合适的,但是对于大量的文本数据检索,是不理想的。全文索引在大量的数据面前,能比like+“%”快N倍,速度不是一个数量级的,但全文索引可能存在精度问题

全文索引的版本、存储引擎、数据类型的支持情况:

  • MySQL5.6以前的版本,只有MyISAM存储引擎支持全文索引
  • MySQL5.6及以后的版本,MyISAM和InnoDB存储引擎均支持全文索引
  • 只有字段的数据类型为char、varchar、text及其系列才可以建全文索引
  • 在数据量较大时候,现将数据放入一个没有全局索引的表中,然后再用create index创建filltext索引,要比先为一张表建立fulltext然后再将数据写入的速度快很多
  • 测试或使用全文索引时,要先看一下自己的MySQL版本、存储引擎和数据类型是否支持全文索引

MySQL中的全文索引有两个变量,最小搜索长度和最大搜索长度,对于长度小于最小搜索长度和长度大于最大搜索长度的词语,都不会被索引。通俗来讲,就是相对一个词语使用全文索引搜索,那么这个词语的长度必须在以上两个变量的区间内,这两个的默认值可以使用以下命令查看:

show variables like '%ft%';

创建:

#方式1 创建表的时候直接指定
create table student(
	sid int primary key,
	card_id varchar(20),
	name varchar(20),
	content varchar(1000),
	fulltext(content) --给content列创建全文索引
);
#方式2 直接创建
create fulltext index index_content on student(content);
#方式3 修改表结构添加索引
alter table student add fulltext index_content(content);

使用全文索引:
使用全文索引和常用的模糊查询like不同,全文索引有自己的语法格式,使用match和against关键字

#语法
match(col1,col2...) against(expr[seach_modifier])
#实现
select * from student where match(content) against('you'); --注意搜索单词要大于最小搜索长度和小于最大搜索长度

空间索引

  • MySQL在5.7之后的版本支持了空间索引,并且支持OpenGIS几何数据模型
  • 空间索引是对空间数据类型的字段建立的索引,MySQL中的空间数据类型有4中,分别是geometry、point、linestring、polygon
  • MySQL使用spatial关键字进行扩展,使得能够用于创建正规索引类型的语法创建空间索引
  • 创建空间索引的列,必须将其声明为not null
类型含义说明
Geometru空间数据任何一种空间类型
Point坐标值
LineString线有一系列点连接而成
Polygon多边形由多条线组成

创建:

create table shop_info(
	id primary key auto_increment comment 'id',
	shop_name varchar(64) not null comment '门店名称',
	geom_point geometry not null comment '经纬度',
	spatial key geom_index(geom_point)
 )

索引原理

  • 一般来说,索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上
  • 这样的话,索引查找过程中就要产生磁盘i/o消耗,相对于内存存取,i/o存取的消耗要高几个数量级,所以评价一个数据结构作为索引的优劣最重要的指标就是在查找过程中磁盘i/o操作次数的渐进复杂度
  • 换句话说,索引的结构组织要尽量减少查找过程中磁盘i/o的存取次数

hash算法:

  • 优点:通过字段的值计算的hash值,定位数据非常快
  • 缺点:不能进行范围查找,因为散列表中的值是无序的,无法进行大小的比较

二叉树算法:

  • 特性:分为左子树、右子树和根节点,左子树比根节点值要小,右子树比根节点值要大
  • 缺点:有可能产生不平衡,类似于链表的结构

平衡二叉树:

  • 特点:它的左子树和右子树都是平衡二叉树;左子树比中间小,右子树比中间大;左子树和右子树的高度之差的绝对值不超过1
  • 缺点:插入操作需要旋转;支持范围查询,但回旋查询效率较低,比如要查找大于8的,会回旋到父节点7、10;如果存放几百条数据的情况下,树高度越高,查询效率会越慢

BTree树:
目前大部分数据库系统及文件系统都采用B-Tree或其变种B+Tree作为索引结构,BTree结构可以有效的解决之前的相关算法遇到的问题

MyISAM使用B+Tree:叶节点的data域存放的是数据记录的地址
InnoDB使用B+Tree:叶节点的data存放的是数据,相比MyISAM效率要更高一些,但是比较占硬盘内存大小

索引特点

优点:

  • 大大加快数据的查询速度
  • 使用分组和排序进行数据查询时,可以显著减少查询时分组和排序的时间
  • 创建唯一索引,能够保证数据库表中每一行数据的唯一性
  • 在实现数据完整性的参考方面,可以加速表和表之间的连接

缺点:

  • 创建索引和维护索引需要消耗时间,并且随着数据量的增加,时间也会增加
  • 索引需要占据磁盘空间
  • 对数据表中的数据进行增删改时,索引也要动态的维护,降低了维护的速度

创建索引的原则

  • 更新频繁的列不应设置索引
  • 数据量小的表不要使用索引
  • 重复数据多的字段不应设置索引(一般来说,重复的数据超过百分之15就不该建索引)
  • 首先应该考虑对where和order by设计的列上建立索引
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值