Oracle堆组织表的索引和索引组织表 :
堆组织表,其索引中记录了数据行所在位置的rowid,查找的时候先找索引,然后再根据索引rowid找到块中的行数据。索引和表的数据是分离的 。
索引组织表,其行数据以索引形式存放,因此找到索引,就等于找到了行数据。索引组织表的索引和数据是在一起的 。
索引组织表,其行数据以索引形式存放,因此找到索引,就等于找到了行数据。索引组织表的索引和数据是在一起的 。
堆组织表索引查找过程 -------
一般索引大概会有3-5层,比如rowid为005,那么它要找到005可能会先从第一层找<1000的,再在第2层找到<100的,然后第3层找到005(注意,这已经是三次io喽),然后再通过005中标识的rowid去对应的磁盘上读取块中的行数据(第4次io)
索引组织表索引查找过程 --------
前面的步骤同上,但是找到005后,由于数据与索引在一起,因此不必再找什么rowid,直接即可返回结果了
-----------------------------------------------------------------------------------------------------------
堆组织表的存储速度因为不用考虑排序, 所以存储速度会比较快. 但是要查找符合某个条件的记录, 就必须得读取全部的记录以便筛选.
而这个时候为了加快查询速度, 索引就出现了, 索引是针对少量特定字段的值拿出来进行排序存储, 并记录在表中的位置,
而因为索引是有序的, 所以就会很容易通过索引查询到具体的记录位置, 然后再根据记录位置直接从表中读取该记录.
同时因为索引的字段较少, 所以索引通常会比其基表小得多.
从上面通过索引访问表记录的方式可以看出, 当要访问的数据量较大时, 通过每一条记录的位置去访问原始记录,
每一条符合条件的记录都需要经过索引访问后再访问基表这样一个复杂的过程, 这会花费很多时间,
同样, 如果不经过索引而直接查询表, 也可能因为表字段太多, 记录较大的情况下把全部的数据读取进来, 这也会花费很多时间.
那怎么办呢?
这个时候就会想到, 如果表中数据本身就是有序的, 这样查询表的时候就可以快速的找到符合条件的记录位置,
而很容易判断符合条件记录的位置, 这样只需要读取一小部分数据出来就可以了, 不需要全表记录都读取出来进行判断.
索引表就这样产生了.当然索引表中插入,更新资料的时候可能会因为需要排序而将数据重组, 这时候数据插入或更新速度会比堆组织表慢一些.
如果堆组织表上有索引, 那么对堆组织表的插入也会因为要修改索引而变慢
我们可以看到堆组织表+索引的方式 与 索引表 都能够实现数据的快速查找, 那为什么不全部采用索引表呢, 这样不是很简单吗?
我能想到的是前者我们可以针对不同的查找条件建立多个索引, 而后者却不行, 后者只能对某一组查询条件有效.
而这个时候为了加快查询速度, 索引就出现了, 索引是针对少量特定字段的值拿出来进行排序存储, 并记录在表中的位置,
而因为索引是有序的, 所以就会很容易通过索引查询到具体的记录位置, 然后再根据记录位置直接从表中读取该记录.
同时因为索引的字段较少, 所以索引通常会比其基表小得多.
从上面通过索引访问表记录的方式可以看出, 当要访问的数据量较大时, 通过每一条记录的位置去访问原始记录,
每一条符合条件的记录都需要经过索引访问后再访问基表这样一个复杂的过程, 这会花费很多时间,
同样, 如果不经过索引而直接查询表, 也可能因为表字段太多, 记录较大的情况下把全部的数据读取进来, 这也会花费很多时间.
那怎么办呢?
这个时候就会想到, 如果表中数据本身就是有序的, 这样查询表的时候就可以快速的找到符合条件的记录位置,
而很容易判断符合条件记录的位置, 这样只需要读取一小部分数据出来就可以了, 不需要全表记录都读取出来进行判断.
索引表就这样产生了.当然索引表中插入,更新资料的时候可能会因为需要排序而将数据重组, 这时候数据插入或更新速度会比堆组织表慢一些.
如果堆组织表上有索引, 那么对堆组织表的插入也会因为要修改索引而变慢
我们可以看到堆组织表+索引的方式 与 索引表 都能够实现数据的快速查找, 那为什么不全部采用索引表呢, 这样不是很简单吗?
我能想到的是前者我们可以针对不同的查找条件建立多个索引, 而后者却不行, 后者只能对某一组查询条件有效.
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/35489/viewspace-604555/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/35489/viewspace-604555/