总结
参考w3school提供的 http://www.w3school.com.cn/sql/sql_datatypes.asp
参考Python课程里面对Ascii,Unicode,UTF-8的讲解,很详细清楚:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431664106267f12e9bef7ee14cf6a8776a479bdec9b9000
char、varchar、nchar、nvarchar的比较:
char查询效率比varchar高一些,空间利用率比varchar低。
nchar和nvarchar存储英文的时候需要耗费的空间是(char,varchar)的两倍,但是可以降低读取出现乱码的概率。
所以:
无中文+长度固定=>char
无中文+长度不固定=>varchar
有中文+长度固定=>nchar
有中文+长度不固定=>nvarchar
Character 字符串类型
CREATE table TbCharacter(
TcNo char(8), --1
TcName varchar(20), --2
TcInfo varchar(max), --3
TcRemark text --4
)
INSERT INTO TbCharacter VALUES ('1班', '小明', '学生信息', '是个懂事的好孩子,以下是一篇描述小明的很多字短文');
--1.char(n) 固定长度的字符串。最多8,000个字符。补充:一般固定长度的编码会使用此类型,编码长度不足n,会用空格补上
--这样也是可以查询出数据的,但是实际数据库的TcNo保存的是'123 '。
select * from TbCharacter where TcNo='1班'
--结果是2,8,3。数据大小<=存储大小,所以一般保存的都是固定长度的编码。
select len(TcNo) as '实际字符串长度(不是字节数)',datalength(TcNo) as '保存字节长度',datalength(rtrim(TcNo)) as '非空字节长度' from TbCharacter where TcNo='1班'
--2.varchar(n) 可变长度的字符串。最多8,000个字符。这个经常使用。
--结果是 2,4,4。证明 数据大小=存储大小,可以用来保存长度不确定的数据。
select len(TcName) as '实际字符串长度(不是字节数)',datalength(TcName) as '保存字节长度',datalength(rtrim(TcName)) as '非空字节长度' from TbCharacter where TcNo='1班'
--3.varchar(max) 可变长度的字符串。最多 1,073,741,824 个字符。
--结果是 4,8,8。证明同上,应该是上面的扩大版,但是不常遇见。
select len(TcInfo) as '实际字符串长度(不是字节数)',datalength(TcInfo) as '保存字节长度',datalength(rtrim(TcInfo)) as '非空字节长度' from TbCharacter where TcNo='1班'
--4.text 可变长度的字符串。最多 2GB 字符数据。
--报错 [Err] 42000 - [SQL Server]参数数据类型 text 对于 len 函数的参数 1 无效。
select len(TcRemark) as '实际字符串长度(不是字节数)' from TbCharacter
--必须写成这个格式,text转换成varchar(max)就可以进行操作
select len(cast([TcRemark] as varchar(max))) as '实际字符串长度(不是字节数)' from TbCharacter
-- 48 ,text类型适用的函数不多,据说有可能被抛弃的类型,使用
select datalength(TcRemark) as '保存字节长度' from TbCharacter
Unicode 字符串类型:
CREATE table TbUnicode(
TuNo nchar(8), --1
TuName nvarchar(20), --2
TuInfo nvarchar(max), --3
TuRemark ntext --4
)
--采用同样的插入数据
INSERT INTO TbUnicode VALUES ('1班', '小明', '学生信息', '是个懂事的好孩子,以下是一篇描述小明的很多字短文');
--1.nchar(n) 固定长度的 Unicode 数据。最多 4,000 个字符。编码长度不足n,会用空格补上
--结果是2,16,4。数据大小<=存储大小,所以一般保存的都是固定长度的编码。nchar的字节长度是char的两倍。就是说如果保存的是英文字符,nchar类型需要的存储空间是char类型的两倍
select len(TuNo) as '实际字符串长度(不是字节数)',datalength(TuNo) as '保存字节长度',datalength(rtrim(TuNo)) as '非空字节长度' from TbUnicode where TuNo='1班'
--2.nvarchar(n) 可变长度的 Unicode 数据。最多 4,000 个字符。
--3.nvarchar(max) 可变长度的 Unicode 数据。最多 536,870,912 个字符。
--4.ntext 可变长度的 Unicode 数据。最多 2GB 字符数据。
Binary 类型:
bit 允许 0、1 或 NULL (我之前遇到的不常用,表示是否也经常使用的是decimal(1,0)这种类型,可能为了方便以后的修改)
image 可变长度的二进制数据。最多 2GB。(一般数据库只会保存图片的路径,很少保存整个图片)
Number 类型:
tinyint 允许从 0 到 255 的所有数字。 1 字节
smallint 允许从 -32,768 到 32,767 的所有数字。 2 字节
int 允许从 -2,147,483,648 到 2,147,483,647 的所有数字。 4 字节
bigint 允许介于 -9,223,372,036,854,775,808 和 9,223,372,036,854,775,807 之间的所有数字。 8 字节
decimal(p,s) 和 numeric(p,s) 没找到什么区别,之前常用的是decimal
固定精度和比例的数字。允许从 -10^38 +1 到 10^38 -1 之间的数字。
p 参数指示可以存储的最大位数(小数点左侧和右侧)。p 必须是 1 到 38 之间的值。默认是 18。
s 参数指示小数点右侧存储的最大位数。s 必须是 0 到 p 之间的值。默认是 0。
5-17 字节
float(n) 从 -1.79E + 308 到 1.79E + 308 的浮动精度数字数据。 参数 n 指示该字段保存 4 字节还是 8 字节。float(24) 保存 4 字节,而 float(53) 保存 8 字节。n 的默认值是 53。 4 或 8 字节
Date 类型:
datetime 从 1753 年 1 月 1 日 到 9999 年 12 月 31 日,精度为 3.33 毫秒。 8 bytes
date 仅存储日期。从 0001 年 1 月 1 日 到 9999 年 12 月 31 日。 3 bytes
time 仅存储时间。精度为 100 纳秒。 3-5 bytes