reference: https://www.reddit.com/r/Database/comments/27u6dy/how_do_you_build_a_database/
大多数数据库使用C编写,使用B-tree数据结构存储数据。过去,有一个叫C-Isam
的C语言库(c library for an indexed sequential access method)被C程序员用来往B-tree格式里写入数据。
多数数据库都是将数据和索引分开存储。假设一个文件里有5行数据,每行800 byte,包含姓氏,名字,地址等信息。想从文件里找到特定名字那一行,可以打开文件一行行搜索,这么做非常低效。这时可以打开一个只包含姓名和对应记录所在行数等索引文件,在这里查找等指定名字所对应记录的行数,然后去存储数据的文件里直接lseek
到那一行就行了。这个过程中,索引文件的查找操作是非常快的,原因是不仅索引文件小并且使用Btree数据结构。
数据库中的表
对应有个存储数据的文件和一个(或者多个)所以文件。索引文件可以对应表里的任意一列。用户可以指定索引去查找数据。
有了数据文件和索引文件,就可以通过ISAM
方法去GET
或者PUT
记录了。现代数据库都会提供SQL查询,所以需要SQL解析器将SQL查询翻译成相应的PUT
或者GET
操作。还需要事务管理和事务日志来撤销或者完成事务。