oracle数据类型与存储结构(by oratea)-CSDN博客

Oracle数据库内建的数据类型主要有如下几种：

。CHAR,NCHAR,VARCHAR2,NVARCHAR2

。NUMBER

。RAW

。LONG,LONG RAW

。DATE

。TIMESTAMP

。INTERVAL

。CLOB,BLOB,NCLOB,BFILE

。ROWID,UROWID

每种不同的数据类型用来存储不同的数据，CHAR存储字符，NUMBER存储数值型。此外，每种数据类型在数据块中的存储结构也是不一样的，他们的存储规则存在很大的区别，下面详细介绍一下每种数据类型在数据库中的存储结构，以及转化的算法。

1， 准备知识

SQL> create table test

2 (id varchar2(10),

3 score number(5,2));

Table created

SQL> insert into test values('a',78);

1 row inserted

SQL> insert into test values('b',85);

1 row inserted

SQL> commit;

Commit complete

SQL> select id,dump(id) from test;

ID DUMP(ID)

---------- --------------------------------------------------------------------------------

a Typ=1 Len=1: 97

b Typ=1 Len=1: 98

SQL> select score,dump(score) from test;

SCORE DUMP(SCORE)

------- --------------------------------------------------------------------------------

78.00 TYP=2Len=2: 193,79

85.00 TYP=2Len=2: 193,86

Oracle在数据块中并不是直接的不加修改的存储我们的数据，而是进行一系列的转化，以一种更高效的方式来存储。从上面的例子可以看出，字符“a”在数据块中用“97”来表示的，数值“78”是用“193，79”来存储的。

注：dump命令可以得到数据在数据库中的存储结构。Dump的语法为dump（数据，进制），默认是转化为10进制的。如果需要转化为16进制，则语法为dump（数据，16）。

2， CHAR,NCHAR,VARCHAR2,NVARCHAR2

CHAR：字符型，单字节，固定长度，最大为2000个字符，内部编码96

VARCHAR2：字符型，单字节，可变长度，最大为4000个字符，内部编码1

NCHAR：字符型，多字节，固定长度，最大为2000个字符，内部编码96

NARCHAR2：字符型，多字节，可变长度，最大为4000个字符，内部编码1

1） CHAR

SQL> create table test_char

2 (a1 char(1),

3 a2 char(5));

Table created

SQL> insert into test_char values('a','ab');

1 row inserted

SQL> commit;

Commit complete

SQL> insert into test_char values('b’,’abc’);

1 row inserted

SQL> commit;

Commit complete

SQL> select a1,dump(a1) from test_char;

A1 DUMP(A1)-- --------------------------------------------------------------------------------

a Typ=96 Len=1: 97

b Typ=96 Len=1: 98

SQL> select a2,dump(a2) from test_char;

A2 DUMP(A2)

----- --------------------------------------------------------------------------------

ab Typ=96 Len=5: 97,98,32,32,32

abc Typ=96 Len=5: 97,98,99,32,32

从dump的结果可以看到：

。CHAR的类型编码Typ为96

。Len表示该数据在数据库中的存储长度，char（1）为1，而char（5）为5

。“a”在数据库的存储格式为“97”，“b”为“98”

。“ab”在数据库的存储格式为“97，98，32，32，32”

。“abc”在数据库的存储格式为“97，98，99，32，32”

结论：

1， CHAR的类型编码Typ为96

2， CHAR在数据库中按固定长度存储，不足的为用空格补齐（chr（32））

3，转化规则

（1）单字节字符：数据库中存储的为数据的ascii码（1个字节）

SQL> select ascii('a') from dual;

ASCII('A')

----------

SQL> select ascii('b') from dual;

ASCII('B')

----------

（2）多字节字符：数据库中存储的为数据的ascii码（多个字节）

SQL> select dump('好') from dual;

DUMP('好')

---------------------

Typ=96 Len=2: 186,195

SQL> select ascii('好') from dual;

ASCII('好')

-----------

47811

SQL> select 186*256 + 195 from dual;

186*256+195

-----------

47811

其中186为高位，195为低位，根据公式ascii码 = 高位*power（2，8）+ 低位，所以'好'的ascii为47811。

2） VARCHAR2

SQL> create table test_varchar2

2 (a1 varchar2(1),

3 a2 varchar2(5));

Table created

SQL> insert into test_varchar2 values ('a','ab');

1 row inserted

SQL> insert into test_varchar2 values ('b','abc');

1 row inserted

SQL> commit;

Commit complete

SQL> select a1,dump(a1) from test_varchar2;

A1 DUMP(A1)

-- --------------------------------------------------------------------------------

a Typ=1 Len=1: 97

b Typ=1 Len=1: 98

SQL> select a2,dump(a2) from test_varchar2;

A2 DUMP(A2)

----- --------------------------------------------------------------------------------

ab Typ=1 Len=2: 97,98

abc Typ=1 Len=3: 97,98,99

从dump的结果可以看到：

。VARCHAR2的类型编码Typ为1

。VARCHAR2类型的数据在数据库的存储长度与实际插入的数据有关系，不需要补位

。“a”在数据库的存储格式为“97”，“b”为“98”

。“ab”在数据库的存储格式为“97，98，32，32，32”

。“abc”在数据库的存储格式为“97，98，99，32，32”

结论：

1， VARCHAR2的类型编码Typ为1

2， VARCHAR2在数据库存储就是数据的实际长度，不需要补位

3，转化规则：与CHAR的转化规则完全一致

另：NCHAR，NVARCHAR2与CHAR，VARCHAR2类似，就不一一介绍了。

结论

1， CHAR与VARCHAR2的最大的区别就是一个2000字节，一个4000个字节，还有就是一个补足空位，一个不需要补空位

2，一般说来数据库能用CHAR的地方都可以利用VARCHAR2来代替，这样可以节省数据库的空间。但是如果对性能有要求的系统来说，合理的使用CHAR会比使用VARCHAR2有更好的性能。

3， NUMBER

SQL> create table test_number

2 (a1 number(8,2));

Table created

SQL> insert into test_number values (0);

1 row inserted

SQL> insert into test_number values (1);

1 row inserted

SQL> insert into test_number values (-1);

1 row inserted

SQL> insert into test_number values (0.12);

1 row inserted

SQL> insert into test_number values (34.56);

1 row inserted

SQL> insert into test_number values (-34.56);

1 row inserted

SQL> commit;

Commit complete

SQL> select a1 ,dump(a1) from test_number;

A1 DUMP(A1)

---------- --------------------------------------------------------------------------------

0.00 Typ=2 Len=1: 128

1.00 Typ=2 Len=2: 193,2

-1.00 Typ=2 Len=3: 62,100,102

0.12 Typ=2 Len=2: 192,13

34.56 Typ=2 Len=3: 193,35,57

-34.56 Typ=2 Len=4: 62,67,45,102

6 rows selected

从dump的结果可以看到：

。NUMBER的类型编码Typ为2

。如果数值为负数那么需要在最后面补一位102，正数和零则不需要

。Len为数值的实际值加上补位的长度

。数值0在数据库的存储格式为128

。数值1在数据库的存储格式为193，2

。数值-1在数据库的存储格式为62，100，102

。数值0.12在数据库存储格式为192，13

。数值34.56在数据库的存储格式为193，35，56

。数值-34.56在数据库的存储格式为62，67，45，102

结论：

1， NUMBER的类型编码Typ为2

2，如果数值为负数那么需要在最后面补一位102，正数和零则不需要

之所以这样处理，是为了更加方便的进行两个数值的大小比较。Oracle在进行数据库中两个数值大小比较的时候，直接比较他们在数据库中的存储格式，并不是把他们转化成我们常用的数值形式后在比较。比如说：比较0和1这两个数，0在数据库中表示为128，1在数据库中表示为193，2，那么直接进行比较‘128’小于‘193’，所以0肯定比1要小。在比如说1和0.12这两个数比较，0.12在数据库中表示为192.13，因为‘193’大于‘192’，所以1肯定比0.12大。这个规则对于正数和0完全适用，但是对于不补位的负数就要出麻烦了。看下面的例子：