索引

转载 2016年05月30日 10:07:34

    数据库索引好比是一本书前面的目录,能够加快数据库的查询速度。数据库索引就是为了提高表的搜索效率而对某些字段中的值建立的目录。

   索引对数据库表中的一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。

索引分为聚簇索引非聚簇索引两种(之后介绍)

   根据数据库的功能,可以在数据库设计器中创建三种索引:唯一索引、主键索引和聚集索引。

   唯一索引:不允许其中任何两行具有相同索引值的索引

   主键索引:在数据库关系图中为表定义主键将自动创建主键索引,主键索引是唯一索引的特定类型。该索引要求主键中的每一个值都唯一。

   聚集索引:表中的物理顺序与键值的逻辑(索引)顺序相同。一个表只能包含一个聚集索引。

   索引列 :可以基于数据库表中的单列或多列创建索引。多列索引可以区分其中一列可能相同的值。

   索引的有效性

   ①检查查询的WHERE和JOIN字句。在任一子句中包括的每一列都是可以选择的对象

   ②对新索引进行试验以检查它对运行查询性能的影响

   ③考虑已在表上创建索引的数量。最后避免在单个表上有很多索引。

   ④检查已在表上创建的索引的定义,最好避免包含共享列的重叠索引。

   ⑤检查某列中唯一数据值的数量,并将该数量与表中的行数进行比较。比较的结果就是该列的可选择性,这有助于确定该列是否适合建立索引。

   基本特点

    建立索引的目的是加快对表中记录的查找或排序,为表设置索引是要付出代价的:①增加了数据库的存储空间②在插入和修改数据时要花费较多的时间(因为索引也要随之变动)

    创建索引可以大大提高系统的性能。第一,通过创建唯一性索引可以保证数据库表中每一列数据的唯一性;第二,可以大大加快数据的检索速度;第三,可以加速表和表之间的连接,特别是在数据的参考完整性方面特别有意义;第四,在使用分组和排序字句进行检索时,同样可以显著减少子查询中分组合排序的时间;第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。

    增加索引也要许多不利的方面。第一,创建索引和维护索引需要耗费时间,这种时间随着数据量的增加而增加;第二,索引需要占物理空间;第三,当对表中的数据进行增加、删除和修改的时候,索引也需要动态的维护,这就降低了数据的维护速度。


   注意事项

索引是建立在数据库表中的某些列的上面。在创建索引的时候,应该考虑在哪些列上可以创建索引,在哪些列上不能创建索引。一般来说,应该在这些列上创建索引

(1)在经常需要搜索的列上

(2)在作为主键的列上,强制该列的唯一性和组织表中的数据的排列结构;

(3)在经常需要排列的列上,这些列主要是一些外键,可以加速连接的速度;

(4)在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;

(5)在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;

(6)在经常使用where字句的列上面创建索引,加快条件的判断速度

同样,对于有些列不应该创建索引,不应该创建索引的列具有下列特点:

(1)对于那些在查询中很少使用或者参考的列不应该创建索引。这是因为,既然这些列很少使用到,因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护速度和增大了空间需求。
(2)对于那些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比例,即需要在表中搜索的数据行的比例很大。增加索引,并不能明显加快检索速度。
(3)对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相当大,要么取值很少,不利于使用索引。
(4)当修改性能远远大于检索性能时,不应该创建索引。这是因为,修改性能和检索性能是互相矛盾的。当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索性能。因此,当修改操作远远多于检索操作时,不应该创建索引。

例1:为出现在where字句的字段建一个索引

CREATE TABLE mytable(
idserial primary key,
category_id int not null default0,
user_id int not null default0,
adddate int not null default0
);
如果在查询时常用类似以下的语句

SELECT * FROM mytableWHERE category_id=1 AND user_id=2;

则可以建立一个多重的索引

CREATE INDEX mytable_categoryid_userid ON mytable(category_id,user_id);

可以用使用EXPLAIN命令来查看MySQL优化器是如何执行SQL语句的


































分区索引--本地索引和全局索引比较

分区索引分为本地(local index)索引和全局索引(global index)。 其中本地索引又可以分为有前缀(prefix)的索引和无前缀(nonprefix)的索引。而全局索引目前只支持有...
  • li19236
  • li19236
  • 2015年04月11日 20:35
  • 2420

数据库索引之稠密索引和稀疏索引

在了解稠密索引和稀疏索引之前,我们先了解下什么是聚集索引。所谓聚集索引指的是:在一个文件中可以有多个索引,分别基于不同的搜索码。(搜索码:用于在文件中查找记录的属性或属性集)如果包含记录的文件按照某个...
  • Qmen_Crow
  • Qmen_Crow
  • 2016年04月03日 21:31
  • 4663

稀疏索引

http://book.51cto.com/art/201012/238283.htm 3.1.3 稀疏索引 稀疏索引只为数据文件的每个存储块设一个键-指针对,它比稠密索引节省了更...
  • scdxmoe
  • scdxmoe
  • 2016年12月27日 16:25
  • 1179

稀疏索引与稠密索引

在谈这两个索引之前,我们要明白为什么要使用索引,当内存容纳不下记录本身大小,我们存储较小的索引,这样查 找记录最多只需要一次I/O操作。 先说一下聚集索引的定义: 聚集索引:在一张表中,如果一个索引有...
  • sand_clock
  • sand_clock
  • 2017年03月30日 09:52
  • 770

pandas层次化索引

import numpy as np import pandas as pd from pandas import Series,DateFrame dd=DataFrame(np.random.ra...
  • Alicia_N
  • Alicia_N
  • 2017年06月25日 19:32
  • 746

在SQLite中使用索引优化查询速度

在进行多个表联合查询的时候,使用索引可以显著的提高速度,刚才用SQLite做了一下测试。建立三个表:create table t1 (id integer primary key,num intege...
  • chu_qun
  • chu_qun
  • 2009年01月06日 10:35
  • 13812

neo4j中索引的使用

neo4j可以对node和relationship中的属性建立索引,索引中的node(relationship)和属性对key-value为多对多的关系。一个node(relationship)可以在...
  • joeadai
  • joeadai
  • 2013年10月27日 00:38
  • 5275

物化视图,索引视图,函数索引;创建索引时使用DESC

一、物化视图 Oracle的物化视图是包括一个查询结果的数据库对像,它是远程数据的的本地副本,或者用来生成基于数据表求和的汇总表。物化视图存储基于远程表的数据,也可以称为快照。 ...
  • buxizhizhou530
  • buxizhizhou530
  • 2015年05月06日 16:32
  • 2235

mongodb3.0的索引管理学习整理

mongodb3.0的索引管理学习整理
  • LOUISLIAOXH
  • LOUISLIAOXH
  • 2016年05月31日 14:51
  • 7909

Greenplum管理索引

鉴于OLAP系统的特性,应该谨慎并保守地使用索引。避免在频繁更新的列上使用索引;在高选择性的列上使用B-tree索引;在低选择性的列上使用Bitmap索引。 通常来说在传统数据库中使用索引可以有效的...
  • gtlions
  • gtlions
  • 2013年04月24日 09:59
  • 3095
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:索引
举报原因:
原因补充:

(最多只允许输入30个字)