一个字节是:
8位,每一位可以是0或1
可以代表 256 个不同值
两个字节是:
16 位
可以表示 65536 个不同值
也就是说字节数越多可以表示的字符数越多;
一个字符中有多少个字节的答案是不固定的,跟字符编码表(是生活中字符和计算机二进制的对应关系)有关
ASCII encoding
包含 128 个不同的字符(可以显示 95 个字符,其余为控制字符),范围从代码 0 到 127(以十进制文字表示的字节值),每个字符需要1个字节
Unicode encoding
(v7) 是一种通用编码。您有 UTF-8、UTF-16 Little Endian 或 Big Endian,以及 UTF-32 Little Endian 或 Big Endian。
- UTF-8 需要 1、2、3 或 4 个字节来表示单个字符。
- UTF-16 是一种固定大小的字符编码:每个字符需要 2 个字节。
- UTF-32 也是一种固定大小的字符编码,每个字符需要 4 个字节。
对于单个字节可以表示 256 个唯一值中的每一个,有数百种不同的编码可以表示字符,每种编码下的字符的所需字节是不一样的。