SQLite剖析之数据类型

SQLite采用动态类型系统,存储类别包括NULL、INTEGER、REAL、TEXT、BLOB。数据的类型与其容器无关,而是与值本身关联。SQLite的列有亲和类型,如TEXT、NUMERIC、INTEGER、REAL、NONE,影响数据存储方式。数值类型在存储时可能会自动转换,如整数亲和类型的列会将无损的浮点数转换为整数。比较表达式和运算符的处理也依赖于数据的存储类型和亲和类型。
摘要由CSDN通过智能技术生成

SQLite剖析之数据类型

    许多SQL数据库引擎(除SQLite之外的各种SQL数据库引擎)使用静态、严格的数据类型。对于静态类型,一个值的数据类型由它的容器,即存储这个值的列来决定。SQLite则使用更加通用的动态类型系统。在SQLite中,一个值的数据类型被关联到这个值本身,而不是它的容器。SQLite的动态类型系统向后兼容一般静态类型系统的数据库引擎。在某种意义上,工作在静态类型数据库上的SQL声明也同样能工作在SQLite上。但是SQLite动态类型还允许做一些在传统严格类型的数据库中不能做的事情。

一、存储类别及数据类型
    在SQLite数据库中存储(或被数据库引擎操作)的每个值,都属于下面存储类别之一:
    * NULL: 值为一个NULL空值。
    * INTEGER: 值被标识为整数,依据值的大小可以依次被存储为1,2,3,4,6或8个字节。
    * REAL: 所有值都是浮点数值,被存储为8字节的IEEE浮点数。
    * TEXT: 值为文本字符串,使用数据库编码存储,如UTF-8、UTF-16BE或UTF-16-LE。
    * BLOB: 值是数据的二进制对象,如何输入就如何存储,不改变格式。
    注意一个存储类别比一个数据类型更通用。例如INTEGER存储类别就包括6个不同长度的整型数据类型,这在磁盘上是不同的。不过只要INTEGER值从磁盘上读到内存中进行处理,它们会转换成最通用的数据类型(8字节的整型),因此在大多数情况下,对“存储类别”和“数据类型”并不做严格区分,这两个术语可交换使用。
    在SQLite3数据库中,除了INTEGER PRIMARY KEY这一列,任何列都可以存储任何类型的数据。SQL语句中的所有值,不管是嵌入到SQL语句文本中的字面值还是绑定到预先编译好的SQL语句中的参数值,都有一个隐式存储类别。在下述情况中,数据库引擎将在执行查询时,可以让存储的值在数值类型(INTEGER和REAL)和文本类型之间转换。
    (1)Boolean数据类型
    SQLite没有单独的布尔数据类型。相应的,布尔值被存储为整型0(false)和1(true)。
    (2)日期和时间数据类型
    SQLite没有单独的日期/时间数据类型。相应的,内建的日期和时间函数能够把日期和时间存储为文本、实数或整数值,以TEXT、REAL和INTEGER类型分别不同的格式表示该类型,如:
    * 文本值为ISO8601字符串("YYYY-MM-DD HH:MM:SS.SSS")。 

TEXT: "YYYY-MM-DD HH:MM:SS.SSS"

    * 实数值为儒略日数,即从公元前4714年11月24日格林威治正午时刻开始的天数,按公历来算。

REAL: 以Julian日期格式存储。

    * 整数值为Unix时间,即从1970-01-01 00:00:00 UTC开始的秒数。

INTEGER: 以Unix时间形式保存数据值,即从1970-01-01 00:00:00到当前时间所流经的秒数。

    应用程序可以选择其中的一种格式来存储日期和时间,也可以通过内建的日期和时间函数在这些格式之间转换。


二、列的亲和类型(类型亲缘性)
  为了最大化SQLite和其它数据库引擎之间的数据类型兼容性,SQLite提出了"类型亲缘性(Type Affinity)"的概念。我们可以这样理解"类型亲缘性",在表字段被声明之后,SQLite都会根据该字段声明时的类型为其选择一种亲缘类型,当数据插入时,该字段的数据将会优先采用亲缘类型作为该值的存储方式,除非亲缘类型不匹配或无法转换当前数据到该亲缘类型,这样SQLite才会考虑其它更适合该值的类型存储该值。SQLite目前的版本支持以下五种亲缘类型:

亲缘类型 描述  
TEXT 数值型数据在被插入之前,需要先被转换为文本格式,之后再插入到目标字段中。
NUMERIC 当文本数据被插入到亲缘性为NUMERIC的字段中时,如果转换操作不会导致数据信息丢失以及完全可逆,那么SQLite就会将该文本数据转换为INTEGER或REAL类型的数据,如果转换失败,SQLite仍会以TEXT方式存储该数据。对于NULL或BLOB类型的新数据,SQLite将不做任何转换,直接以NULL或BLOB的方式存储该数据。需要额外说明的是,对于浮点格式的常量文本,如"30000.0",如果该值可以转换为INTEGER同时又不会丢失数值信息,那么SQLite就会将其转换为INTEGER的存储方式。
INTEGER 对于亲缘类型为INTEGER的字段,其规则等同于NUMERIC,唯一差别是在执行CAST表达式时。
REAL 其规则基本等同于NUMERIC,唯一的差别是不会将"30000.0"这样的文本数据转换为INTEGER存储方式。
NONE 不做任何的转换,直接以该数据所属的数据类型进行存储。  

    在SQLite 3中,值被定义为何种类型只和值自身有关,与列无关,和变量也没有关系(被称作弱类型)。而其它的数据库引擎都受静态类型系统的限制,其值的类型是由其所属列的属性决定的,而与值本身无关。为了最大限度的增加SQLite数据库和其他数据库的兼容性,SQLite支持列的“亲和类型”概念。列的亲和类型是指为该列所存储的数据建议一个类型,要注意这个类型是建议而不是强迫。任何列依然是可以存储任何类型的数据的。只是针对某些列,如果有建议类型的话,数据库将优先按所建议的类型存储。这个被优先使用的数据类型称为“亲和类型”。
    SQLite 3的每个列均可以使用以下亲和类型中的一种:TEXT、NUMERIC、INTEGER、REAL、NONE。
    带有文本亲和类型的列可以使用NULL、TEXT或BLOB类型来存储所有数据。如果数值数据被插入到这样的列中,会在存储之前转换成文本类型。
    带有数值亲和类型的列可以使用所有五种类型来存储值。当文本数据被插入到数据值型的列中时,如果转换是无损的且可逆的,则文本会被转换成INTEGER或REAL(按优先顺序)。为了在TEXT和REAL之间转换,SQLite尝试无损且可逆地转换文本的开头15个有效十进制数字。如果不能成功转换的话,值则只能按文本类型存储了,而不会被转换成NULL类型或BLOB类型来存储。带有小数点或指数记法的字符串可能看起来像一个浮点字面值,但只要值能表示为一个整数,数值亲和类型将把它转换成一个整数。因此,字符串'3.0e+5'会被转换成整数300000,而不是浮点数300000.0。
    使用整数亲和类型的列,其行为与数值亲和类型的列一样。但也有些区别,比如没有小数部分的实数字面值被插入整数亲和类型的列时,它将被转换成整数并按整数类型存储。
    使用实数亲和类型的列,其行为与数值亲和类型的列一样。但有一个区别,就是整数会强制用浮点数来表示。(作为一个内部优化,无小数部分的小浮点数会当作整数写入磁盘,以占用更少的空间。当读出这个值时会自动转换回浮点数。这个优化在SQL级别完全不可见,并且只有通过检测数据库文件的原始比特位才能发现)。
    使用NONE亲和类型的列不会优先选择使用哪个类型,在数据被存储前也不会强迫转换它的类型,而是直接按它声明时的原始类型来存储。

    (1)列亲和类型的确定(决定字段亲缘性的规则)

    列的亲和类型由列的声明类型(在写SQL语句时指定)来确定,即字段的亲缘性是根据该字段在声明时被定义的类型来决定,根据以下规则顺序来判断:
    1)如果列的声明类型包含字符串"INT",则被定义为整数亲和类型。
    2)如果列的声明类型包含字符串"CHAR"、"CLOB"或"TEXT"中的某一个,则列具有文本亲和类型。注意VARCHAR类型包含字符串"CHAR",因此被定义为文本亲和类型。
    3)如果列的声明类型包含字符串"BLOB",或者没有为列声明数据类型,则列具有NONE亲和类型。
    4)如果列的声明类型包含字符串"REAL"、"FLOA"或"DOUB"中的某一个,则列具有REAL亲和类型。
    5)否则,列的亲和类型为NUMERIC。
    需要注意的是以下情况的列表顺序,即如果某一字段类型同时符合两种亲缘性,那么排在前面的规则将先产生作用。确定列亲和类型的规则顺序非常重要,声明类型为"CHARINT"的列匹配规则1和2,但按顺序优先使用规则1,因此列被定义为整数亲和类型。

    (2)亲和类型名称实例

    按照上面5条规则,下面例子显示传统SQL实现中的各种通用数据类型(CREATE TABLE语句或CAST表达式中的数据类型)怎样被转化成SQLite中的亲和类型。这里只是所有传统数据类型中的一部分,它们能够被SQLite接受。注意跟在类型名后面的括号中的数字参数在SQLite中被忽略。SQLite不在字符串、BLOB对象或数值上强加任何长度限制(除了大的全局SQLITE_MAX_LENGTH限制)。
    * INT, INTEGER, TINYINT, SMALLINT, MEDIUMINT, BIGINT, UNSIGNED BIG INT, INT2, INT8: 定义为INTEGER亲和类型(按规则1)。
    * CHARACTER(20), VARCHAR(255), VARYING CHARACTER(255), NCHAR(255), NATIVE CHARACTER(70), NVARCHAR(100), TEXT, CLOB: 定义为TEXT亲和类型(按规则2)。
    * BLOB, 不声明类型: 定义为NONE亲和类型(按规则3)。
    * REAL, DOUBLE, DOUBLE PRECISION, FLOAT: 定义为REAL亲和类型(按规则4)。
    * NUMERIC, DECIMAL(10,5), BOOLEAN, DATE, DATETIME: 定义为NUMERIC亲和类型(按规则5)。
    注意声明类型"FLOATING POINT"将得到INTEGER亲和类型,而不是REAL亲和类型,因为"POINT"中有子串"INT"。声明类型"STRING"为NUMERIC亲和类型,而不是TEXT。

    (3)列亲和类型转化实例

    SQL示范:当值被插入到表中时,SQLite是怎样使用亲和类型来做类型转换。

复制代码
CREATE TABLE t1(  
    t  TEXT,     -- text affinity by rule 2  
    nu NUMERIC,  -- numeric affinity by rule 5  
    i  INTEGER,  -- integer affinity by rule 1  
    r  REAL,     -- real affinity by rule 4  
    no BLOB      -- no affinity by rule 3  
);  
  
-- Values stored as TEXT, INTEGER, INTEGER, REAL, TEXT.  
INSERT INTO t1 VALUES('500.0', '500.0', '500.0', '500.0', '500.0');  
SELECT typeof(t), typeof(nu), typeof(i), typeof(r), typeof(no) 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值