介绍
数据库是构建软件系统的重要组成部分,用于有效地存储和读取数据。在这里,我们将使用早期版本的SQLite讨论数据库实现的一些体系结构细节。
SQLite是一个小型数据库应用程序,用于数百万个软件和设备。SQLite是由D.Richard Hipp于2000年8月发明的.SQLite是一个高性能,轻量级的关系数据库。如果您愿意在编码级别学习数据库的内部,那么SQLite是最好的开源数据库,具有高度可读的源代码和大量文档。阅读更高版本的SQLite变得有点困难,因为它包含许多新功能。为了理解数据库内部的基本实现,您应该对数据结构,计算理论以及操作系统的工作原理有一定的了解。
在这里,我们将研究SQLite 2.5.0版本。您可以在GitHub上找到 SQLite后端的简单实现。
为什么数据库
将数据保存在平面文件中并不能有效地读取和存储数据。数据库按正确顺序组织数据,以便数据读取和写入速度更快。数据可以是结构化的,半结构化的或非结构化的。数据库主要用于存储结构化和半结构化数据。可以根据要存储的数据结构的类型,按如下方式调度数据库。
- 关系数据库:常用的数据库类型,具有表结构。表可以与其他表有关系。用于处理此类数据库上的数据的SQL语言。
- 键值数据库:存储的数据以及与之关联的键。可以使用给定密钥检索数据。内存数据库通常被发现为这种类型的数据库。
- 对象数据库:数据结构更像是对象而不是表。
- 图形数据库:图形数据库是主要用于数据挖掘和社交媒体应用程序的节点和边缘的集合。
SQLite数据库架构
SQLite数据库体系结构分为两个不同的部分,分别命名为核心和后端。核心部分包含接口,令牌生成器,分析器,代码生成器和虚拟机,它们为数据库事务创建执行顺序。后端包含访问文件系统的B树,寻呼机和OS接口。Tokenizer,Parser和代码生成器共同命名为编译器,它生成一组在虚拟机上运行的操作码。
我从哪里开始?
要了解数据库的体系结构,您需要具备以下先决条件。
- 很好地理解数据结构和算法。特别是B树,链表,Hashmaps等数据结构。
- 对计算机体系结构有所了解 如何读写磁盘,分页和缓存如何工作。
- 理论计算机,如有限自动机和一些正则表达式知识。
SQLite架构
VFS(虚拟文件系统)
Unix和Windows上的文件访问权限彼此不同。VFS提供了访问文件的通用API,而不考虑其运行的操作系统的类型。此API包括打开,读取,写入和关闭文件的功能。以下是VFS中用于读取,将数据写入文件的一些API。
/ *
创建文件连接以进行读写
zFilename:文件名
id:文件指针
pReadonly:读或写
* /
int sqliteOsOpenReadWrite(const char * zFilename,OsFile * id,int * pReadonly);
/ *
获取锁定以读取文件。这个功能应该是
在调用任何文件读取函数之前调用。
如果成功则返回0
id:文件指针
* /