由字符到字节,是编码--encode
由字节到字符,是解码--decode
流向:
电脑(字节) ——》解码——》人(字符)
人(字符)——》编码——》电脑(字节)
/编码:字节数组,每个汉字2个字节,字母1个
byte[] datas = msg.getBytes();
System.out.println(datas.length);//14
//UTF-16LE 每个汉字2个字节,字母2个
datas = msg.getBytes("UTF-16LE");
System.out.println(datas.length);//16
//编码:字节数组,每个汉字2个字节,字母1个
datas = msg.getBytes("GBK");
System.out.println(datas.length);//14
解码出现乱码的原因:
1,字节数不够。
2,字符集不统一,例如:字节是utf-8 转字符转成了gbk