SQLite数据库文件格式

最新推荐文章于 2024-07-01 02:12:19 发布

liushan0302

最新推荐文章于 2024-07-01 02:12:19 发布

阅读量2.9k

点赞数

分类专栏： SQLite

SQLite 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

相关源代码：

btreeInt.h(以下很多内容都在这个文件的注释中)

Btree.h

Btree.c

sqlite数据库内部由一组可扩展的数组组成，每个数组项是一个页（page），页号从1开始，页号0为null，物理上不存在。从sqlite数据库文件的0偏移开始这些页一个接一个的排列着。

页类型

leaf, internal, overflow, and free

叶子页、内部页、溢出页，空闲页

页结构如下：

** |----------------|

** | file header | 100 bytes. Page 1 only. 文件头（100字节）

** |----------------|

** | page header | 8 bytes for leaves. 12 bytes for interior nodes （叶子页8字节，内部页12字节）

** |----------------|

** | cell pointer | | 2 bytes per cell. Sorted order.（单元指针数组）

** | array | | Grows downward

** | | v

** |----------------|

** | unallocated |

** | space |

** |----------------| ^ Grows upwards （未分配空间）

** | cell content | | Arbitrary order interspersed with freeblocks.

** | area | | and free space fragments. （单元内容区）

** |----------------|

Btree页内部以单元(cell)为单位来组织数据，一个单元包含一个(或部分，当使用溢出页时)payload(也称为Btree记录)。由于各类数据大小各不相同，每个单元的大小也就是可变的，所以Btree页内部的空间需要进行动态分配(程序内部动态分配，不是动态申请空间)，单元是Btree页内部进行空间分配和回收的基本单位。页内所有单元的内容集中在页的底部，称为“单元内容区”，由下向上增长。由于单元的大小可变，因此需要对每个单元在页内的起始位置(称为单元指针)进行记录。单元指针保存在单元指针数组中，位于页头之后。单元指针数组包含0个或多个指针，由上向下增长。单元指针数组和单元内容区相向增长，中间部分为未分配空间。系统尽量保证未分配空间位于最后的指针之后，这样，就很容易增加新的单元，而不需要整理碎片。单元不需要是相邻和有序的，但单元指针是相邻和有序的。每个指针占2个字节，表示该单元在单元内容区中距页开始处的偏移。页中单元的数量保存在页头中。

文件头：

每个btree页由三部分组成：页头、单元指针数组、单元内容。数据库第一页还有额外100字节地文件头。

除了在页号1的位置，sqlite可以使用任何类型的页。1号页总是一个B+树的内部页。这个页在偏移0的位置包含了100字节的文件头，描述了这个数据库的特性。sqlite创建数据库文件的时候初始化文件头。文件头结构如下：

Table 2-1. Structure of database file header
Offset	Size	Description	内容
0	16	Header string	SQLITE format 3
16	2	Page size in bytes	每页的大小（字节数）
18	1	File format write version	默认为1
19	1	File format read version	默认为1
20	1	Bytes reserved at the end of each page	页预留空间（字节）
21	1	Max embedded payload fraction	一个cell/record在内部页中可占用的最大空间
22	1	Min embedded payload fraction	一个cell/record在内部页中可占用的最小空间
23	1	Min leaf payload fraction	一个cell/record在叶子页中可占用的最小空间
24	4	File change counter	用于事务，每个事务都会引起该值增加，由pager管理
28	4	Reserved for future use
32	4	First freelist page	空闲页链表，下面有详细说明
36	4	Number of freelist pages	空闲页数量
40	60	15 4-byte meta values

关于这个文件头结构在sqlite源码sqliteInt.h中有详细介绍。

** OFFSET SIZE DESCRIPTION

** 0 16 Header string: "SQLite format 3\000"

** 16 2 Page size in bytes. (1 means 65536)

** 18 1 File format write version

** 19 1 File format read version

** 20 1 Bytes of unused space at the end of each page

** 21 1 Max embedded payload fraction (must be 64)

** 22 1 Min embedded payload fraction (must be 32)

** 23 1 Min leaf payload fraction (must be 32)

** 24 4 File change counter

** 28 4 Reserved for future use

** 32 4 First freelist page

** 36 4 Number of freelist pages in the file

** 40 60 15 4-byte meta values passed to higher layers

** 40 4 Schema cookie

** 44 4 File format of schema layer

** 48 4 Size of page cache

** 52 4 Largest root-page (auto/incr_vacuum)

** 56 4 1=UTF-8 2=UTF16le 3=UTF16be

** 60 4 User version

** 64 4 Incremental vacuum mode

** 68 4 Application-ID

** 72 20 unused

** 92 4 The version-valid-for number

** 96 4 SQLITE_VERSION_NUMBER

** 页头格式如下：

** OFFSET SIZE DESCRIPTION

** 0 1 Flags. 1: intkey, 2: zerodata, 4: leafdata, 8: leaf 页类型

** 1 2 byte offset to the first freeblock 第一个自由块的偏移

** 3 2 number of cells on this page 本页cell的数量

** 5 2 first byte of the cell content area 第一个cell内容的起始地址

** 7 1 number of fragmented free bytes 碎片字节数

** 8 4 Right child (the Ptr(N) value). Omitted on leaves.右孩子页号。叶子页没有此属性。

页类型：

如果leaf位被设置，则该页是一个叶子页，没有儿子；

如果zerodata位被设置，则该页只有关键字，而没有数据；

如果intkey位被设置，则关键字是整型；

如果leafdata位设置，则tree只存储数据在叶子页。

注：以上内容见于大多数SQLite介绍性文档，btreeInt.h中也这么说。但通过分析程序代码，结论如下：上述描述与实际实现是矛盾的。可以这样理解：就不用管各标志位的含义了，如果是B+tree的叶子页，该字节值为0X0D，如果是B+tree的内部页，该字节值为0X05，如果是B-tree的叶子页，该字节值为0X0A，如果是B-tree的内部页，该字节值为0X02。由此可见：intkey标志倒是可以作为判断B+tree树和B-tree的标志（置1为B+tree树），程序中实际也是这样应用的。

第1个自由块的偏移量：

由于随机地插入和删除单元，将会导致一个页上单元和空闲区域互相交错。单元内容区域中没有使用的空间收集起来形成一个空闲块链表，这些空闲块按照它们地址的升序排列。页头偏移为1的2个字节指向空闲块链表的头。每个空闲块至少4个字节，因为一个空闲块的开始4个字节存储控制信息：前2个字节指向下一个空闲块(0意味着没有下一个空闲块了)，后2个字节为该空闲块的大小。

碎片的字节数：

由于空闲块大小至少为4个字节，所以单元内容区中的3个字节或更小的自由空间(称为碎片，fragment)不能存在于空闲块列表中。所有碎片的总的字节数将记录在页头偏移为7的位置(碎片最多为255个字节，在它达到最大值之前，页会被整理)。单元内容区的起始地址：单元内容区的起始地址记录在页头偏移为5的地方。这个值为单元内容区域和未使用区域的分界线。

空闲块格式：

** SIZE DESCRIPTION

** 2 Byte offset of the next freeblock 下一个空闲块的偏移量

** 2 Bytes in this freeblock 当前空闲块的字节数

最右儿子的页号：

如果本Btree页是叶子页，则无此域，页头长为8个字节。如果本Btree页为内部页，则有此域，页头长为12个字节。页头偏移为8的4个字节包含指向最右儿子的指针。

溢出页：

溢出页形成了一个链表。除了最后一页的所有页都填满数据，最后一个页甚至有可能只有1字节的数据。一个溢出页不会存储来自两个单元的数据。

空闲页：

文件头32字节偏移处的空闲链表结构如下：

主干页格式如下：

4字节页号，指向下一个主干页

4字节整数表示该页叶子页指针的数量

0或多于4字节的叶子页

当一个页变得不活跃时（无用）时，sqlite就把它加入空闲链中，而不会归还给文件系统。当有新的数据加入数据库时，sqlite就从空闲链中取出新的页面来存储信息。如果空闲链为空，sqlite就向操作系统申请新的页来扩展。

命令“vacuum”可以重写当前数据库，在事务的保护下释放空闲链表，缩小数据库文件。

cell结构：

** SIZE DESCRIPTION

** 4 Page number of the left child. Omitted if leaf flag is set. （左孩子页号，叶子页忽略）

** var Number of bytes of data. Omitted if the zerodata flag is set. （数据的字节数）

** var Number of bytes of key. Or the key itself if intkey flag is set. （key的字节数）

** * Payload

** 4 First page of the overflow chain. Omitted if no overflow （溢出页的首页页号，无溢出页则忽略）

一、叶子页

单元是一个变长的字节串。一个单元包含一个（或部分，当使用溢出页时）payload。

payload格式：

每个payload由两部分组成。第1部分是记录头，由N+1个可变长整数组成，N为记录中的字段数。第1个可变长整数(header-size)的值为记录头的字节数。跟着的N个可变长整数与记录的各字段一一对应，

表示各字段的数据类型和宽度。用可变长整数表示各字段类型和宽度的规定如下表所示：

header-size的值包括header-size本身的字节和Type1~TypeN的字节。

二、内部页

** ----------------------------------------------------------------

** | Ptr(0) | Key(0) | Ptr(1) | Key(1) | ... | Key(N-1) | Ptr(N) |

** ----------------------------------------------------------------

B+tree中根页(rootpage)和内部页(internalpages)都是用来导航的，这些页的指针域都是指向下级页的指针，数据域仅仅包含关键字。所有的数据库记录都存储在叶子页(leafpages)内。

在叶节点一级，页和页内的单元都是按照关键字的顺序排列的，所以B+tree可以沿水平方向遍历，时间复杂度为O(1)。

内部页包含N个关键值(Key(0)~Key(N-1))和N+1个子页指针(Ptr(0)~Ptr(N))，其值为子页的页号。其中，Ptr(N)存储在页头中偏移为8的地方(4字节整数，只有内部页的页头有此域，参“Btree页格式介绍”一节)。其他的每对子页指针和关键值(Ptr(i)和Key(i))组成1个单元，共N个单元。Ptr(i)所指向子树中关键字的最大值<=Key(i)，Ptr(N)所指向子树中关键字的值都>Key(N-1)。

注：

参考资料：

1、inside SQLite第二章数据库文件格式（我尝试翻译了下，但是翻的太烂了。。。嘿嘿）

2、百度文库一篇文章，分析得非常详细，非常棒。我有很大一部分是整理的这位作者的，附上原作者。

http://wenku.baidu.com/link?url=SlUW-5xFiU4mLCJy9PWw5xdEbFoNVmYd8k-Nq1dgFqs-lhmS5ldEoJKLoySjFMufBPywwLHu04_hPsc5INvRmD66CZHhf4e7pvuURLLTdNq

3、源码注释说明