关闭

Index 概论

标签: SQL索引index
719人阅读 评论(0) 收藏 举报
分类:

索引类型

 

唯一索引:唯一索引不允许两行具有相同的索引值

主键索引:为表定义一个主键将自动创建主键索引,主键索引是唯一索引的特殊类型。主键索引要求主键中的每个值是唯一的,并且不能为空

聚集索引(Clustered):表中各行的物理顺序与键值的逻辑(索引)顺序相同,每个表只能有一个

非聚集索引(Non-clustered):非聚集索引指定表的逻辑顺序。数据存储在一个位置,索引存储在另一个位置,索引中包含指向数据存储位置的指针。可以有多个,小于249个

 

关于聚集索引和非聚集索引:

    聚簇索引即建立在聚簇上的索引,创建聚簇索引时,需要对已有表数据重新进行排序(若表中已有数据),即删除原始的表数据后再将排序结果按物理顺序插回,故聚簇索引建立完毕后,建立聚簇索引的列中的数据已经全部按序排列。

   一个表中只能包含一个聚簇索引,但该索引可以包含多个列。

   B-树索引中,聚簇索引的叶层就是数据页。

  非聚簇索引类似书本索引,索引与数据存放在不同的物理区域,建立非聚簇索引时数据本身不进行排序。一个表中科含多个非聚簇索引。

   B-树索引中,非聚簇索引的叶层仍是索引页,其以指针指向数据页实际存储位置。

 

优点

加快访问速度

加强行的唯一性

缺点

带索引的表在数据库中需要更多的存储空间

操纵数据的命令需要更长的处理时间,因为它们需要对索引进行更新

 

请按照下列标准选择建立索引的列。

该列用于频繁搜索

该列用于对数据进行排序

 

一、索引的概念

       索引就是加快检索表中数据的方法。数据库的索引类似于书籍的索引。在书籍中,索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息。在数据库中,索引也允许数据库程序迅速地找到表中的数据,而不必扫描整个数据库。

二、索引的特点

    1.索引可以加快数据库的检索速度

    2.索引降低了数据库插入、修改、删除等维护任务的速度

    3.索引创建在表上,不能创建在视图上

    4.索引既可以直接创建,也可以间接创建

    5.可以在优化隐藏中,使用索引

    6.使用查询处理器执行SQL语句,在一个表上,一次只能使用一个索引

    7.其他

三、索引的优点

    1.创建唯一性索引,保证数据库表中每一行数据的唯一性

    2.大大加快数据的检索速度,这也是创建索引的最主要的原因

    3.加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。

    4.在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。

    5.通过使用索引,可以在查询的过程中使用优化隐藏器,提高系统的性能。

四、索引的缺点

    1.创建索引和维护索引要耗费时间,这种时间随着数据量的增加而增加

   2.索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大

    3.当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度

五、索引分类

    1.直接创建索引和间接创建索引

    直接创建索引: CREATE INDEX mycolumn_index ONmytable (myclumn)

    间接创建索引:定义主键约束或者唯一性键约束,可以间接创建索引

    2.普通索引和唯一性索引

    普通索引:CREATE INDEX mycolumn_index ON mytable(myclumn)

    唯一性索引:保证在索引列中的全部数据是唯一的,对聚簇索引和非聚簇索引都可以使用

    CREATE UNIQUE COUSTERED INDEXmyclumn_cindex ON mytable(mycolumn)

    3.单个索引和复合索引

    单个索引:即非复合索引

    复合索引:又叫组合索引,在索引建立语句中同时包含多个字段名,最多16个字段

    CREATE INDEX name_index ONusername(firstname,lastname)

    4.聚簇索引和非聚簇索引(聚集索引,群集索引)

   聚簇索引:物理索引,与基表的物理顺序相同,数据值的顺序总是按照顺序排列

    CREATE CLUSTERED INDEX mycolumn_cindex ONmytable(mycolumn) WITH

    ALLOW_DUP_ROW(允许有重复记录的聚簇索引)

   非聚簇索引:CREATE UNCLUSTERED INDEXmycolumn_cindex ON mytable(mycolumn)

六、索引的使用

   1.当字段数据更新频率较低,查询使用频率较高并且存在大量重复值是建议使用聚簇索引

    2.经常同时存取多列,且每列都含有重复值可考虑建立组合索引

   3.复合索引的前导列一定好控制好,否则无法起到索引的效果。如果查询时前导列不在查询条件中则该复合索引不会被使用。前导列一定是使用最频繁的列

   4.多表操作在被实际执行前,查询优化器会根据连接条件,列出几组可能的连接方案并从中找出系统开销最小的最佳方案。连接条件要充份考虑带有索引的表、行数多的表;内外表的选择可由公式:外层表中的匹配行数*内层表中每一次查找的次数确定,乘积最小为最佳方案

   5.where子句中对列的任何操作结果都是在sql运行时逐列计算得到的,因此它不得不进行表搜索,而没有使用该列上面的索引;如果这些结果在查询编译时就能得到,那么就可以被sql优化器优化,使用索引,避免表搜索(例:select* from record where substring(card_no,1,4)=’5378’

&&select * from record where card_no like’5378%’)任何对列的操作都将导致表扫描,它包括数据库函数、计算表达式等等,查询时要尽可能将操作移至等号右边

    6.where条件中的’in’在逻辑上相当于’or’,所以语法分析器会将in('0','1')转化为column='0' orcolumn='1'来执行。我们期望它会根据每个or子句分别查找,再将结果相加,这样可以利用column上的索引;但实际上它却采用了"or策略",即先取出满足每个or子句的行,存入临时数据库的工作表中,再建立唯一索引以去掉重复行,最后从这个临时表中计算结果。因此,实际过程没有利用column上索引,并且完成时间还要受tempdb数据库性能的影响。in、or子句常会使用工作表,使索引失效;如果不产生大量重复值,可以考虑把子句拆开;拆开的子句中应该包含索引

    7.要善于使用存储过程,它使sql变得更加灵活和高效



0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场