线程名 | 文件名 | 说明 |
---|---|---|
ADIO线程 | aiocompleter.cpp | 该线程主要负责异步-同步读写操作(ADIO,asynchronous-direct input-ouput)的后台预取和回写 |
autovacuum线程 | autovacuum.cpp | 该线程主要负责磁盘引擎的后台空闲空间回收 |
bgwriter线程 | bgwriter.cpp | 该线程主要负责行存储表的后台脏页写入磁盘(当内存数据页跟磁盘数据页内容不一致的时候,称这个内存页为“脏页”。内存数据写入到磁盘后,内存和磁盘上的数据页的内容就一致了,称为“干净页”) |
cbmwriter线程 | cbmwriter.cpp | 该线程主要负责增量页面修改信息的后台异步提取和CBM(changed block map,修改页面位图)日志的记录 |
checkpointer线程 | checkpointer.cpp | 该线程主要负责在后台定期推进数据库的故障恢复点 |
lwlockmonitor线程 | lwlockmonitor.cpp | 该线程主要负责业务线程轻量级锁的死锁检测 |
pagewriter线程 | pagewriter.cpp | 该线程主要负责行存储共享缓冲区的脏页写入磁盘 |
pgarch线程 | pgarch.cpp | 该线程主要负责在后台定期执行日志归档命令 |
remoteservice线程 | remoteservice.cpp | 该线程主要负责接收主机页面修复RPC(remote procedure call,远程函数调用)请求 |
startup线程 | startup.cpp | 该线程为数据库故障恢复和回放日志的主线程 |
walwriter线程 | walwriter.cpp | 该线程主要负责在后台异步写入磁盘日志 |
4.2 磁盘引擎
磁盘引擎是数据库系统中最常用的存储引擎,openGauss提供不同存储格式的磁盘引擎来支持大容量(数据量大于内存空间)场景下的OLTP、OLAP和HTAP(hybrid transactions and analytics processing,混合交易和分析处理)业务。本节主要介绍openGauss数据库内核中磁盘引擎的实现方式。
4.2.1 磁盘引擎整体框架及代码概览
磁盘引擎的整体框架如图4-1中所示。根据与上层SQL引擎之间交互的数据结构类型,可以分为行存储格式和列存储格式。这两种数据格式共用相同的事务并发控制、日志系统、持久化和故障恢复、主备系统。
在此基础之上,行存储格式内部设计为可以支持多种不同子格式的可扩展架构。不同行存储子格式之间共用相同的行存储统一访存接口(table access method)、共享缓冲区、索引机制等。当前仅支持追加写优化的astore子格式,后续计划支持写优化的ustore子格式以及面向其他场景优化的其他子格式。另一方面,在openGauss行存储格式中,对同一行数据的写-写查询冲突通过两阶段锁协议来实现并发控制(参见第5章中关于行级锁的介绍),对同一行数据的读-写查询冲突通过行级多版本技术来实现互不阻塞的、高效的并发控制。对于不同的行存储子格式,可能采用不同的行级多版本实现方式,从而也会引入不同的、清理历史版本的空闲空间管理和回收机制。
磁盘引擎的主要功能模块和代码分布如表4-4所示。
表4-4 磁盘引擎功能模块
功能模块名 | 说明 |
---|---|
行存储统一访存管理 | 向上对接SQL引擎,提供对行存储表各类访存操作的抽象接口,包括:行级查询、插入、删除、修改等操作接口;向下根据行存储表实际的行存储子格式,调用与子格式对应的具体访存操作实现 代码主要在“src/gausskernel/storage/access/table”目录下 |
astore访存管理 | 提供astore行存储格式表的具体访存操作实现,包括:对astore堆表的行级查询、插入、删除、修改等操作接口;astore堆表行级多版本机制和元组可见性判断;根据astore堆表页间、页内结构,以及astore堆表元组结构,完成对astore堆表文件的遍历和增删改查操作 代码主要在“src/gausskernel/storage/access/heap”目录(单表文件管理)和“src/gausskernel/storage/access/hbstore”目录(段页式文件管理)下 |
astore堆表/索引表页面结构 |