COMP9315 week4b 课堂笔记

最新推荐文章于 2021-07-11 12:18:19 发布

我不是狼人

最新推荐文章于 2021-07-11 12:18:19 发布

阅读量476

点赞数

分类专栏： DBMS

本文链接：https://blog.csdn.net/weixin_43733909/article/details/105802693

版权

本文详细介绍了PSQL中的扫描（Scanning）过程，包括heap file的暴力扫描及其代价，以及不同类型的扫描操作。此外，文章还深入讨论了排序（Sorting）的策略，如外部排序、归并排序，并分析了其成本。PSQL使用sort keys和SortTuples减少页面读取，提高效率。同时，文中提到了分区（Partitioning）阶段的哈希函数应用以及去重策略。

摘要由CSDN通过智能技术生成

Scanning

在这里插入图片描述
抓取所有pages中的tuples作为结果集。
Page Cost：b（一个表的data file中pages的总数）

PSQL的heap file可以带overflow pages。

如上，暴力scanning的代价是b+b(Ov)，b(Ov)是overflow pages的总数。
如果不按顺序，则可以如下：
在这里插入图片描述
找到最多1个结果的query：通过primary key：

代价：
最好情况：1个page（tuple在第一个page）
最坏情况：b个page（tuple在最后一个page或者不存在）
平均情况：b/2个page

在这里插入图片描述
如果hash function比较好，则overflow file不会特别大。
最好情况：存在在data pages。
最坏情况：遍历所有data file和overflow file。
平均情况：大约一半的data file和一半的overflow chain找到。
Hash仅用于“相等”的情况。
所以“>50”只能搜索全部的pages。

在这里插入图片描述
Relation r里包括了file descriptor等信息。

在这里插入图片描述
大致步骤：得到page(加载到memory)->得到record->转换成tuple
curPage是memory里page的指针。
nTuples§（一共多少个tuples）的信息在page的开头的directory中。
nPages(rel)的信息在relation中。
Relation的结构如下：

next_tuple():
在这里插入图片描述

get_page(red,0)–>获取relation的第一个page。
如果current tuple id与nTuples(s->curPage)的相等，则说明已便利所有的tuple，我们继续获得新的page，如果了fi

最低0.47元/天解锁文章

我不是狼人

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
COMP9315 week4b 课堂笔记

Scanning抓取所有pages中的tuples作为结果集。Page Cost：b（一个表的data file中pages的总数）PSQL的heap file可以带overflow pages。如上，暴力scanning的代价是b+b(Ov)，b(Ov)是overflow pages的总数。如果不按顺序，则可以如下：找到最多1个结果的query：通过primary key：...
复制链接

扫一扫