UTF-8 编码 UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。 UTF-8 是一种变长的编码方式。它可以使用 1-6 个字节表示一个符号,根据不同的符号而变化字节长度。 UTF-8 的编码规则: 对于单字节的 UTF-8 编码,该字节的最高位为 0,其余 7 位用来对字符进行编码(等同于 ASCII 码)。 对于多字节的UTF-8编码,如果编码包含 n 个字节,那么第一个字节的前 n 位为1,第一个字节的第 n+1 位为0,该字节的剩余各位用来对字符进行编码。在第一个字节之后的所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。