引言(Introduction)
在前面一节中知道,PostgreSQL具有许多系统表与系统视图,这些资源是PostgreSQL数据库系统运行控制信息的来源,是数据库的核心组成部分。但在拷贝并编译PostgreSQL源码之后,还需要通过运行initdb命令初始化数据库。initdb命令是源码中提供的初始化数据库的二进制可运行文件,可以直接运行。初始化的步骤需要生成系统表,模板数据库和相应的目录、文件信息。本节主要介绍initdb的初始化数据集簇的过程。
系统表初始化
系统表分为关键系统表与非关键系统表,关键系统表包含了系统的一些基本信息,如pg_tablespace包含数据库的物理内存信息,pg_type包含数据库的类型信息。因此系统表初始化必须发生在模板数据库生成之前。因为在关键表生成之前是无法使用类似于SQL这些语言定义的(因为都还没有知道物理信息与类型信息等),所以系统表的初始化要在bootstrap模式进行。具体过程是initdb通过外部调用的方式执行postgres程序,该程序进入bootstrap模型并读取postgres.bki文件来创建与填充系统表与创建模板数据库。
BKI文件是一种特殊语言的脚本文件,这些脚本允许postgresql在bootstrap模式下允许不存在系统表的情况下执行数据库函数。
系统表的初始化顺序是关键表在前,其余表在后。
Initdb的执行过程
数据库的初始化可以看作是一个原子操作的过程,所以必须要屏蔽一些中断信号。
系统数据库
在创建数据集簇之后,默认存在三个系统数据库template1、template0与postgres。其中template0与postgres都是通过拷贝template1而来的,用户创建的数据库如果没有明确指明,那么都是由template1拷贝而来。同时,用户也可以修改template1的信息,改变后续创建的数据库。因此template0充当了最粗版本的template1的作用。而postgres数据库的作用是充当用户连接的数据库,类似于Linux系统中用户的home目录。
参考资料(References)
《PostgreSQL数据库内核分析》