一个字符占几个字节?
- 在ASCII码编码方案中,一个英文字符占用一个字节,一个汉字字符占用两个字节的空间;
- 在Unicode编码方案中,一个英文字符或一个汉字字符都占用两个字节的空间;
- 3.在UTF-8编码方案中,一个英文字符占用一个字节,一个汉字字符占用三个字节的空间。
如何理解
信息通常以字符编码的方式存在于计算机中,并进行信息传播。而字符编码又有不同的方案,鉴于世界上有各种各样的语言字符信息,为了把这些符号信息编码到计算机中,并进行互相传播,字符的编码方案也层出不穷。
下面对以下三种字符编码方案加以介绍:
-
ASCII码。ASCII码是美国信息交换标准编码,是世界上最通用的计算机符号编码。ASCII码用7个二进制位共编码128个字符。
在ASCII编码中,一个英文字母或其他字符占用一个字节,一个中文汉字在ASCII码的兼容方案中占用两个字节。 -
Unicode定长编码。统一码,Universal Multiple-OctetCoded Character Set,简称UCS,俗称unicode,万国码。
世界上所有的语言包含的符号,都在unicode里面有唯一的编码。Uicode采用两个字节的编码方式,把世界上所有的语言的文字字符都容纳了进来。
在Unicode的编码方案中,一个英文字母或字符占用两个字节的空间,同样一个中文字符包括繁体字,也是占用两个字节的空间。 -
UTF-8编码,不定长度编码。UTF,全称Unicode Transfer Format,统一码传输格式。它是一种针对Unicode的一种可变长度的字符编码方案。
UTF-8编码使用1~4个字节对所有的字符进行编码,对于ASCIl码的那些字符采用一个字节,从而保证与ASCIl的完全兼容。
对于拉丁文、希伯来文等字母采用2个字节进行编码;对于中日韩、东南亚等文字,采用3个字节进行编码。
1818

被折叠的 条评论
为什么被折叠?



