Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示

转载 2011年12月28日 18:05:55

如果还为了这个纠结,就直接看看后面的解说,做决定吧。

一般如果用到中文或者其它特殊字符,我就会使用n开头的类型,否则的话直接使用var开头的。 

sql server中的varchar和Nvarchar有什么区别?

 
答:
varchar(n)
长度为 n 个字节的可变长度且非 Unicode 的字符数据。n 必须是一个介于 1 和 8,000 之间的数值。存储大小为输入数据的字节的实际长度,而不是 n 个字节。

nvarchar(n)
包含 n 个字符的可变长度 Unicode 字符数据。n 的值必须介于 1 与 4,000 之间。字节的存储大小是所输入字符个数的两倍。

两字段分别有字段值:我和coffee
那么varchar字段占2×2+6=10个字节的存储空间,而nvarchar字段占8×2=16个字节的存储空间。

如字段值只是英文可选择varchar,而字段值存在较多的双字节(中文、韩文等)字符时用nvarchar
 
 
联机帮助上的:
char(n)  定长 索引效率高 程序里面使用trim去除多余的空白 n 必须是一个介于 1 和 8,000 之间的数值,存储大小为 n 个字节
varchar(n) 变长 效率没char高 灵活 n 必须是一个介于 1 和 8,000 之间的数值。存储大小为输入数据的字节的实际长度,而不是 n 个字节
text(n) 变长 非Unicode数据  
nchar(n) 定长 处理unicode数据类型(所有的字符使用两个字节表示) n 的值必须介于 1 与 4,000 之间。存储大小为 n 字节的两倍
nvarchar(n) 变长 处理unicode数据类型(所有的字符使用两个字节表示) n 的值必须介于 1 与 4,000 之间。字节的存储大小是所输入字符个数的两倍。所输入的数据字符长度可以为零
ntext(n)  变长 处理unicode数据类型(所有的字符使用两个字节表示)  
出处:http://blog.sina.com.cn/s/blog_44e571d70100cagf.html

一般来说,如果含有中文字符,用nchar/nvarchar,如果纯英文和数字,用char/varchar

这里总结的不错
http://www.cnblogs.com/ebaidu/archive/2007/08/14/854778.html
 
 
很多开发者进行数据库设计的时候往往并没有太多的考虑char, varchar类型,有的是根本就没注意,因为存储价格变得越来越便宜了,忘记了最开始的一些基本设计理论和原则,这点让我想到了现在的年轻人,大手一挥一把人民币就从他手里溜走了,其实我想不管是做人也好,做开发也好,细节的把握直接决定很多东西。当然还有一部分人是根本就没弄清楚他们的区别,也就随便选一个。在这里我想对他们做个简单的分析,当然如果有不对的地方希望大家指教。

1、CHAR。CHAR存储定长数据很方便,CHAR字段上的索引效率级高,比如定义char(10),那么不论你存储的数据是否达到了10个字节,都要占去10个字节的空间,不足的自动用空格填充,所以在读取的时候可能要多次用到trim()

2、VARCHAR。存储变长数据,但存储效率没有CHAR高。如果一个字段可能的值是不固定长度的,我们只知道它不可能超过10个字符,把它定义为 VARCHAR(10)是最合算的。VARCHAR类型的实际长度是它的值的实际长度+1。为什么“+1”呢?这一个字节用于保存实际使用了多大的长度。从空间上考虑,用varchar合适;从效率上考虑,用char合适,关键是根据实际情况找到权衡点。

3、TEXT。text存储可变长度的非Unicode数据,最大长度为2^31-1(2,147,483,647)个字符。

4、NCHAR、NVARCHAR、NTEXT。这三种从名字上看比前面三种多了个“N”。它表示存储的是Unicode数据类型的字符。我们知道字符中,英文字符只需要一个字节存储就足够了,但汉字众多,需要两个字节存储,英文与汉字同时存在时容易造成混乱,Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示。nchar、nvarchar的长度是在1到4000之间。和char、varchar比较起来,nchar、nvarchar则最多存储4000个字符,不论是英文还是汉字;而char、varchar最多能存储8000个英文,4000个汉字。可以看出使用nchar、nvarchar数据类型时不用担心输入的字符是英文还是汉字,较为方便,但在存储英文时数量上有些损失。

所以一般来说,如果含有中文字符,用nchar/nvarchar,如果纯英文和数字,用char/varchar

我把他们的区别概括成:
CHAR,NCHAR 定长,速度快,占空间大,需处理
VARCHAR,NVARCHAR,TEXT 不定长,空间小,速度慢,无需处理
NCHAR、NVARCHAR、NTEXT处理Unicode码
 
 
varchar在SQL Server中是采用单字节来存储数据的,nvarchar是使用Unicode来存储数据的.中文字符存储到SQL Server中会保存为两个字节(一般采用Unico编码),英文字符保存到数据库中,如果字段的类型为varchar,则只会占用一个字节,而如果字段的类型为nvarchar,则会占用两个字节
  正常情况下,我们使用varchar
也可以存储中文字符,但是如果遇到操作系统是英文操作系统并且对中文字体的支持不全面时, 在SQL Server存储中文字符为varchar就会出现乱码(显示为??).而且正常情况下,主机都会支持中文的环境,所以如果使用varchar来存储数据,在开发阶段是发现不了的.多数情况下,在布署
  
当然,使用nvarchar存储英文字符会增大一倍的存储空间.但是在存储代价已经很低廉的情况下,优先考虑兼容性会给你带来更多好处的.
  所以在Design的时候应该尽量使用nvarchar来存储数据.只有在你确保该字段不会保存中文的时候,才采用varchar来存储.的时候也不会有问题.
  但是!如果布署的主机是英文操作系统,并且不支持中文环境,那问题就出来了.所有的varchar字段在存储中文的时候都会变成乱码(显示为??).而且一般情况下你不会知道这是因为你采用了错误的数据类型来存储所造成的,你会试着去装中文字体,试着去设置操作系统的语言环境...这些都不能解决问题,唯一能解决问题的是把数据库字段的类型个性为nvarchar(或者nchar).对项目管理比较熟悉的朋友应该都知道,到布署阶段再来修改数据库是一个很恐怖的事情.
  使用nvarchar的另一个非常好处就是在判断字符串的时候可以不需要考虑中英文两种字符的差别.

Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示

如果还为了这个纠结,就直接看看后面的解说,做决定吧。 一般如果用到中文或者其它特殊字符,我就会使用n开头的类型,否则的话直接使用var开头的。  sql server中的varchar和Nva...
  • Andeewu
  • Andeewu
  • 2013年11月25日 22:03
  • 706

Unicode字符集和多字节字符集关系(一)

Unicode字符集和多字节字符集关系  在最初的时候,Internet上只有一种字符集——ANSI的ASCII字符集,它使用7 bits来表示一个字符,总共表示128个字符,其中包括了英文字母、数字...
  • bao_bei
  • bao_bei
  • 2016年07月12日 14:56
  • 270

Unicode字符集与多字节字符集(这里的字符指的是字符变量,统称Char TCHAR WCHAR之类相关的东西

成因:有些国际市场以大字符集来使用日文和中文等语言,所以简单地使用ASCII字符集来表示A,a,B,b……@,#,*已经不能满足需要了。 Microsoft基础类库 (MFC) 支持以两种方式处理大...
  • m041130112
  • m041130112
  • 2016年09月10日 16:04
  • 251

关于”unicode字符是2个字节“这句话的讨论

很多人,即使是有一些项目经验的人,都说过这句话。但是如果深入的理解什么是unicode之后就会知道,原来我们经常说的这句话“unicode字符是2个字节”这句话是有问题的。 要说清楚这个问题,首先就...
  • kemaWCZ
  • kemaWCZ
  • 2016年02月26日 13:58
  • 2752

单字节字符集,多字节字符集,Unicode

所有的   string   类都是以C-style字符串为基础的。C-style   字符串是字符数组。所以我们先介绍字符类型。这里有3种编码模式对应3种字符类型。 第一种编码类型是单子节字符集(s...
  • leixiaohua1020
  • leixiaohua1020
  • 2013年10月15日 18:51
  • 5051

UNICODE,一个字符就是两个字节

  • tuhuolong
  • tuhuolong
  • 2012年11月07日 16:56
  • 370

字符集(ansi、unicode、utf-8、utf-16、多字节字符(mutil-byte)、宽字节字符)

1、宽字节就是在说unicode,多字节就是在说ansi、gb等。 2、unicode是一种字符集,utf-8等 是它的不同实现方式,可以实现所有语言的表示。 3、unicode和ucs是一种...
  • jiayichendddd
  • jiayichendddd
  • 2014年06月05日 20:39
  • 1013

1.宽字节字符集(unicode)和多字节字符集

多字节字符集和宽字节字符集 一、多字节字符集 每个字符的编码宽度都不等,可以是一个或多个字节 1.      ASCII字符只占用一个字节。 2.      对于中文,日文等象形字,由于其数量...
  • lsfreeing
  • lsfreeing
  • 2014年10月27日 16:34
  • 1474

ANSI编码和Unicode编码之深入理解

利用今天一天的时间,研究了一下ANSI编码和Unicode编码的不同,下面把我的研究成果写下来,以备日后参考。         ANSI编码最常见的应用就是在Windows当中的记事本程序中,当新建一...
  • zmx729618
  • zmx729618
  • 2016年06月08日 16:50
  • 904

【总结】Java和Unicode字符集

        现今使用的绝大多数操作系统都采用ASCII代码集表示字符。ASCII最初使用7位码表示大小写字母、数字0~9以及若干控制字符,如NUL和EOT。在西欧,用户希望代码集能表示他们本国字符...
  • wyingquan
  • wyingquan
  • 2005年02月24日 22:19
  • 2111
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Unicode字符集就是为了解决字符集这种不兼容的问题而产生的,它所有的字符都用两个字节表示,即英文字符也是用两个字节表示
举报原因:
原因补充:

(最多只允许输入30个字)