1. 堆内元组
当一个元组被更新时,那么由于它的TID改了,索引也需要删除与插入,这是个工作量比较大的活。为了避免索引的频繁删除插入。使用元组头部的t_infomask2字段来标记旧元组与更新的新元组。这个字段将用于后续的元组清理。不动索引,而是通过索引找到旧元组,再由旧元组头部的指针找到新元组:
但是这样依然有问题,因为旧元组可能在清理的时候被删了,那么索引就找不到旧元组,也就找不到新元组了。为了解决这个问题,pg会在适合的时候进行剪枝,通过旧元组的行指针找到新元组的行指针,以找到新元组:
并在何时的时候进行碎片清理来删除旧元组。以上就是HOT。
HOT有时不可用:
- 当新旧元组不在统一个页面时,因为旧元组的行指针不能指向新元组的行指针了。
- 当索引键更新时,这是一定需要在索引中插入新索引项的,因为旧元组被删除的话,索引的键与新元组的对不上。
2. 仅索引扫描
当一个查询的所有列都有索引时,让我们觉得可以只扫描索引结构,而无需扫描堆元组。但是由于索引结构并不包含数据的可见性,所以还是得去扫描堆元组,一个一个地去查它的t_xmin是否可见,以及是否有t_xmax等。
为了减少这样的扫描,仅索引扫描会先去VM中检查目标元组所在的页是否可见,如果可见,则该元组一定可见,就不用去堆元组中查它对应的事务的可见性了。如果不可见,那么还是要去查它对应的事务的可见性。