java中的编码与解码以及乱码的原因总结_java编码和解码过程中的常见错误有哪些-CSDN博客

本文链接：https://blog.csdn.net/weixin_43211195/article/details/98140398

因为计算机只识别二进制数，所以编码与解码可以理解为以下

编码
字符 -->字节（是字符转字节的过程）
解码
字节–>字符（是字节转字符的过程）

乱码的原因：

①编码与解码的字符集不统一

public class Main {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String msg = "我对编程很感兴趣a";
        //编码，字节数组
        byte[] datas = msg.getBytes("GBK");  //字符串转字节，是编码的过程;
        System.out.println(msg);

        //解码：字符串String(byte[] bytes,int offset,int length,String charsetName)
        msg = new String(datas,0,datas.length,"utf8");
        System.out.println(msg);
    }
}

以上例子以GBK进行编码，以utf8进行解码，编码与解码的字符集不统一，出现乱码
运行结果为

我对编程很感兴趣a
�ҶԱ�̺ܸ���Ȥa

②解码的字符数与编码的字符数不一样

public class Main {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String msg = "我对编程很感兴趣";
        //编码，字节数组
        byte[] datas = msg.getBytes("GBK");  //字符串转字节，是编码的过程;其中getBytes()方法没有指明编码的格式所以默认是工程编码;
        System.out.println(msg);

        //解码：字符串String(byte[] bytes,int offset,int length,String charsetName)
        msg = new String(datas,0,datas.length-1,"GBK");
        System.out.println(msg);
    }
}

输出结果为

我对编程很感兴趣
我对编程很感兴�

虽然都是以“GBK”的方式进行编码与解码，但是由于解码长度影响了最后一个字符的解码
（注意：utf-8编码中一个中文字符占3个字节
一个字母占一个字节。而GBK编码方式中一个中文字符占2个字节，一个字母占一个字节。）

java中的编码与解码 以及乱码的原因总结

觉得还可以的小伙伴可以点个赞再离开啦！

java中的编码与解码以及乱码的原因总结