SQLite剖析之设计与概念

本文深入剖析SQLite Version 3的设计与概念,包括API的两大组成部分、新特性如并发性能提升、B-树改进及存储模型扩展。主要数据结构包括Connection、Statement、B-tree和pager,以及事务和锁管理。核心API涉及SQL命令执行,如prepared query的三个阶段:preparation、execution和finalization。文章还详细介绍了连接生命周期、事务处理和锁的状态,展示了SQLite如何高效处理并发读写操作。
摘要由CSDN通过智能技术生成

SQLite剖析之设计与概念

1.API
  由两部分组成: 核心API(core API)和扩展API(extension API)。
  核心API的函数实现基本的数据库操作:连接数据库、处理SQL、遍历结果集。它也包括一些实用函数,比如:字符串转换、操作控制、调试和错误处理。
  扩展API通过创建你自定义的SQL函数去扩展SQLite。

1.1、SQLite Version 3的一些新特点

(1)SQLite的API全部重新设计,由第二版的15个函数增加到88个函数。这些函数包括支持UTF-8和UTF-16编码的功能函数。
(2)改进并发性能。加锁子系统引进一种锁升级模型(lock escalation model),解决了第二版的写进程饿死的问题(该问题是任何一个DBMS必须面对的问题)。这种模型保证写进程按照先来先服务的算法得到排斥锁(Exclusive Lock)。甚至,写进程通过把结果写入临时缓冲区(Temporary Buffer),可以在得到排斥锁之前就能开始工作。这对于写要求较高的应用,性能可提高400%。
(3)改进的B-树。对于表采用B+树,大大提高查询效率。
(4)SQLite 3最重要的改变是它的存储模型。由第二版只支持文本模型,扩展到支持5种本地数据类型。
总之,SQLite Version 3与SQLite Vertion 2有很大的不同,在灵活性,特点和性能方面有很大的改进。

1.2、主要的数据结构(The Principal Data Structures)

  SQLite由很多部分组成:parser、tokenize、virtual machine等等。
  但是从程序员的角度,最需要知道的是:connection、statements、B-tree和pager。它们之间的关系:

  上图告诉我们在编程时需要知道的三个主要方面:API、事务(Transaction)和锁(Locks)。
  从技术上来说,B-tree和pager不是API的一部分,但是它们却在事务和锁上起着关键作用。

1.3、Connections和Statements

  Connection和Statement是执行SQL命令涉及的两个主要数据结构,几乎所有通过API进行的操作都要用到它们。一个连接(Connection)代表在一个独立的事务环境下的一个连接(a connection represents a single connection to a database as well as a single transaction context)。每一个statement都和一个connection关联,它通常表示一个编译过的SQL语句,在内部它以VDBE字节码表示。Statement包括执行一个命令所需要一切,包括保存VDBE程序执行状态所需的资源、指向硬盘记录的B-树游标、以及参数等等。

1.4、B-tree和pager

  一个connection可以有多个database对象—一个主要的数据库以及附加的数据库,每一个数据库对象有一个B-tree对象,一个B-tree有一个pager对象(这里的对象不是面向对象的“对象”,只是为了说清楚问题)。
  Statement最终都是通过connection的B-tree和pager从数据库读或者写数据,通过B-tree的游标(cursor)遍历存储在页面(page)中的记录。游标在访问页面之前要把数据从disk加载到内存,而这就是pager的任务。任何时候,如果B-tree需要页面,它都会请求pager从disk读取数据,然后把页面(page)加载到页面缓冲区(page cache),之后,B-tree和与之关联的游标就可以访问位于page中的记录了。
  如果cursor改变了page,为了防止事务回滚,pager必须采取特殊的方式保存原来的page。总的来说,pager负责读写数据库,管理内存缓存和页面(page),以及管理事务、锁和崩溃恢复。
  总之,关于connection和transaction,要知道两件事:
   (1) 对数据库的任何操作,一个连接存在于一个事务下。
   (2) 一个连接决不会同时存在多个事务下。
  whenever a connection does anything with a database, it always operates under exactly one transaction, no more, no less.

1.5、核心API

  核心API主要与执行SQL命令有关,本质上有两种方法执行SQL语句:prepared query 和wrapped query。prepared query由三个阶段构成:preparation、execution和finalization。其实wrapped query只是对prepared query的三个过程包装而已,最终也会转化为prepared query的执行。

1.5.1、连接的生命周期(The Connection Lifecycle)
  和大多数据库连接相同,由三个过程构成:

  (1) 连接数据库(Connect to the database):
  每一个SQLite数据库都存储在单独的操作系统文件中,连接、打开数据库的C API为:sqlite3_open(),它的实现位于main.c文件中,如下:

int sqlite3_open(const char *zFilename, sqlite3 **
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值