这个和字符编码有关。所谓字符编码,就是规定了如何将字符串转成byte[]。
同一个汉字,在不同的字符编码下,得到的结果也不同。
例如,"中国"
GBK 编码: D6 D0 B9 FA
UTF-8 编码:E4 B8 AD E5 9B BD
以GBK编码时,一个汉字得到2个字节。
以UTF-8编码时,一个汉字得到2~3个字节。
这个和字符编码有关。所谓字符编码,就是规定了如何将字符串转成byte[]。
同一个汉字,在不同的字符编码下,得到的结果也不同。
例如,"中国"
GBK 编码: D6 D0 B9 FA
UTF-8 编码:E4 B8 AD E5 9B BD
以GBK编码时,一个汉字得到2个字节。
以UTF-8编码时,一个汉字得到2~3个字节。