字符与字节
ASCII码:一个英文字母(不分大小写)占一个字节的空间,一个中文
汉字占两个字节的空间。一个
二进制数字序列,在
计算机中作为一个数字单元,一般为8位二进制数,换算为
十进制。最小值-128,最大值127。如一个ASCII码就是一个字节。
UTF-8编码:一个英文
字符等于一个字节,一个中文(含繁体)等于三个字节。中文标点占三个字节,英文标点占一个字节
Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于
两个字节。中文标点占两个字节,英文标点占两个字节
不同数量级间
1KB=1000B;1MB=1000KB=1000×1000B。其中1000=10
3。
1B(byte,字节)= 8 bit(见下文);
字符串
在
内存中,如果“
字符”是以
ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串为
ANSI字符串或者多字节字符串。如,"中文123" (占8字节,包括一个隐藏的\0)。
字符集