中文的编码数字都为负数。
GBK:2字节代表一个文字。
UTF-8:3字节代表一个文字。
编码:字符串变为字节数组。
解码:字节数子变为字符串。
String-byte[ ] str.getBytes(charsetName)
byte[ ]-String new String(byte[ ],charsetName)
byte[ ] b="abc".getBytes("GBK");
String s=new String(b,"utf-8");
UTF-8根据数据的头标记来判断向下读几个字节,如果是0,表示读一个。110,10读2个。1110,10,10读三个。
联通因为二进制符合u8的解码形式,所以记事本会使用u8进行解码。出现乱码。