author:skate
time :2009/08/21
为什么要创建索引呢?这是因为,创建索引可以大大提高系统的性能,他都有哪些优点:
第一,通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。
第二,可以大大加快 数据的检索速度,这也是创建索引的最主要的原因。
第三,可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。
第四,在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。
第五,通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能
索引虽然优点非常多,但也不是越多越好,增加索引的同时也会带来一些负面的影响
第一,创建索引和维护索引要耗费时间,这种时间随着数据 量的增加而增加。
第二,索引需要占物理空间,除了数据表占数据空间之外,每一个索引还要占一定的物理空间,如果要建立聚簇索引,那么需要的空间就会更大。
第三,当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,这样就降低了数据的维护速度。
索引是建立在数据库表中的某些列的上面。因此,在创建索引的时候,应该仔细考虑在哪些列上可以创建索引,在哪些列上不适合创建索引。一般来说,应该在如下列上创建索引,例如
1. 在经常需要搜索的列上,可以加快搜索的速度;
2。在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
3. 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
4. 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
5. 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
6. 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。
同样,对于有些列不应该创建索引。一般来说,不应该创建索引的的这些列具有下列特点:
1,对于那些在查询中很少使用或者参考的列不应该创建索引。这是因 为,既然这些列很少使用到,
因此有索引或者无索引,并不能提高查询速度。相反,由于增加了索引,反而降低了系统的维护
速度和增大了空间需求。
2,对于那 些只有很少数据值的列也不应该增加索引。这是因为,由于这些列的取值很少,例如人事
表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比 例,即需要在表中搜索的
数据行的比例很大。增加索引,并不能明显加快检索速度。
3,对于那些定义为text, image和bit数据类型的列不应该增加索引。这是因为,这些列的数据量要么相
当大,要么取值很少。
4,当修改性能远远大于检索性能时,不应该创建索 引。这是因为,修改性能和检索性能是互相矛盾的。
当增加索引时,会提高检索性能,但是会降低修改性能。当减少索引时,会提高修改性能,降低检索
性能。因 此,当修改性能远远大于检索性能时,不应该创建索引。
创建索引,要在适当的表,适当的列创建适当数量的适当索引
1. 根据表的大小创建索引
索引可以提高查询性能,但同时也会降低更新的性能,所以在创建索引的之前,要先仔细考察下表的大小
表太小,就不是建立索引,如果表只有百十条记录的字典表(数据量没什么变化),创建索引几乎不能没有
任何改善,相反索引的维护成本,要比这个大的多,也就是说,你花了很多钱买了很少的东西(你是个冤大头)。
有的人会问,小表不用创建索引,那大表就一定要创建索引了吧,其实那也不是绝对的,只要大家理解了索引的
访问数据的原理就会明白的(通过索引找到记录对应的rowid,再通过rowid找到真实的数据),如果在一个很少查询
,但更新很频繁的表上创建索引,就不是合适,因为在大表上创建索引的维护成本要远高于小的表的索引,是不是有点
迷糊了, 那到底在大表上是否创建索引呢?我觉得这要评估下对这个表的访问数据量,如果查询量大于10%的话,就不要
创建索引了,因为那会反而影响执行的性能,这个值只是经验值,如果你非要确定这个值,那你就要测试分析,看添加索引
和全表扫描那个速度更快
2.根据列的特征创建索引
上面已经说了,那些列上该创建索引:
1. 在经常需要搜索的列上,可以加快搜索的速度;
2。在作为主键的列上,强制该列的唯一性和组织表中数据的排列结构;
3. 在经常用在连接的列上,这些列主要是一些外键,可以加快连接的速度;
4. 在经常需要根据范围进行搜索的列上创建索引,因为索引已经排序,其指定的范围是连续的;
5. 在经常需要排序的列上创建索引,因为索引已经排序,这样查询可以利用索引的排序,加快排序查询时间;
6. 在经常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。
2. 一个表上创建多少索引
表的索引可以提高查询速度,但也降低更新速度,我们在考虑创建多少索引的时候,要考虑在查询和更新之间找
一个平衡点,例如像分析系统,主要用于查询,很少更新,就可以多创建些索引,及时更新也是很少或着是导数据
,在导数据的时候可是disable索引,导完数据库之后在enable索引
sql优化是一个动态的过程,因为他是根据数据量的不同,而在不断的变化。需要定期监控以便于对其进一步的优化
对于DB设计者、SQL制作者、DBA在优化SQL时,存在以下效率的高低:
追加约束条件 > 调整SQL逻辑 > 设计INDEX > 加入Hint
开发者优化SQL的主要精力应该放在对SQL本身的编写组织上。而且越后面的风险也越大。
因为开发环境、测试环境、最终客户环境的数据量、数据库版本、硬件等等总会有不同;
而Hint是强制执行的(自动忽略错误Hint语句),
就会产生在某处高效的Hint,在另一处却非常耗费资源。
如果不是可以在最终客户环境上操作的人员,最好不要写Hint,
最多只要做好INDEX,
Oracle的自动优化不会轻易放过它的。
---end---