首先,介绍二者之间的一些区别。
一、nchar和nvarchar
nchar是固定长度Unicode数据的数据类型,nvarchar是可变长度Unicode数据的数据类型,二者均使用UNICODEUCS-2字符集。
nchar(n)
包含n个字符的固定长度Unicode字符数据。n的值必须介于1与4,000之间。存储大小为n字节的两倍。nchar在SQL-92中的同义词为nationalchar和nationalcharacter。
nvarchar(n)
包含n个字符的可变长度Unicode字符数据。n的值必须介于1与4,000之间。字节的存储大小是所输入字符个数的两倍。所输入的数据字符长度可以为零。nvarchar在SQL-92中的同义词为nationalcharvarying和nationalcharactervarying。
注释
1. 如果没有在数据定义或变量声明语句中指定n,则默认长度为1。如果没有使用CAST函数指定n,则默认长度为30。
2. 如果希望列中所有数据项的大小接近一致,则使用nchar。
3. 如果希望列中数据项的大小差异很大,则使用nvarchar。
4. 使用nchar或nvarchar的对象被赋予数据库的默认排序规则,除非使用COLLATE子句赋予特定的排序规则。
5. SETANSI_PADDINGOFF不适用于nchar或nvarchar。SETANSI_PADDINGON永远适用于nchar和nvarchar。
二、char和varchar
固定长度(char)或可变长度(varchar)字符数据类型。
char[(n)]
长度为n个字节的固定长度且非Unicode的字符数据。n必须是一个介于1和8,000之间的数值。存储大小为n个字节。char在SQL-92中的同义词为character。
varchar[(n)]
长度为n个字节的可变长度且非Unicode的字符数据。n必须是一个介于1和8,000之间的数值。存储大小为输入数据的字节的实际长度,而不是n个字节。所输入的数据字符长度可以为零。varchar在SQL-92中的同义词为charvarying或charactervarying。
注释
1. 如果没有在数据定义或变量声明语句中指定n,则默认长度为1。如果没有使用CAST函数指定n,则默认长度为30。
2. 将为使用char或varchar的对象被指派数据库的默认排序规则,除非用COLLATE子句另外指派了特定的排序规则。该排序规则控制用于存储字符数据的代码页。
3. 支持多语言的站点应考虑使用Unicodenchar或nvarchar数据类型以尽量减少字符转换问题。
4. 如果使用char或varchar:
如果希望列中的数据值大小接近一致,请使用char。
如果希望列中的数据值大小显著不同,请使用varchar。
如果执行CreateTABLE或AlterTABLE时SETANSI_PADDING为OFF,则一个定义为NULL的char列将被作为varchar处理。
5. 当排序规则代码页使用双字节字符时,存储大小仍然为n个字节。根据字符串的不同,n个字节的存储大小可能小于n个字符。
下面,介绍一些在数据库中使用的情况。
1. char与varchar的比较
下面是使用char与varcahr的一些结果。
(1)数据存储开销。
a. 每个varchar列需要额外的两个字节,用于反映存储的数据的长度。
b. 每个可为NULL的char列,需要一些字节(空位图)来反应数据的为空性。
c. 无论实际数据的长度是多少,char按照定义的长度分配存储空间。
d. varchar根据实际存储的数据长度来分配数据存储空间。
(2) NULL值。
a. char列的NULL值占用存储空间。
b. varcahr列的NULL值不占用存储空间。
c. 插入同样数量的NULL值,varchar列的插入效率明显高出char列。
(3) 插入数据。无论插入数据涉及的列是否建立索引,char的效率都明显低于varchar。
(4) 更新数据
如果更新的列上未建立索引,则char的效率低于varchar,差异不大;建立索引的话,效率差异较大。
(5) 修改结构
a. 无论增加或是删除的列的类型是char还是varchar,操作都能较快的完成,而且效率上没有什么差异。
b. 对于增加列的宽度而言,char与varchar有非常明显的效率差异,修改varcahr列基本上不花费时间,而修改char列需要花费很长的时间。
(6) 数据检索。无论是否通过索引,varchar类型的数据检索略优于char的扫描。
2. 选择char还是选择varchar的建议
(1) 适宜于char的情况:
a. 列中的各行数据长度基本一致,长度变化不超过50字节;
b. 数据变更频繁,数据检索的需求较少。
c. 列的长度不会变化,修改char类型列的宽度的代价比较大。
d. 列中不会出现大量的NULL值。
e. 列上不需要建立过多的索引,过多的索引对char列的数据变更影响较大。
(2) 适宜于archar的情况;
a. 列中的各行数据的长度差异比较大。
b. 列中数据的更新非常少,但查询非常频繁。
c. 列中经常没有数据,为NULL值或为空值。