java中的编码与解码 以及乱码的原因总结

因为计算机只识别二进制数,所以编码与解码可以理解为以下

编码
字符 -->字节 (是字符转字节的过程)
解码
字节–>字符(是字节转字符的过程)

乱码的原因:

①编码与解码的字符集不统一

public class Main {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String msg = "我对编程很感兴趣a";
        //编码,字节数组
        byte[] datas = msg.getBytes("GBK");  //字符串转字节,是编码的过程;
        System.out.println(msg);

        //解码:字符串String(byte[] bytes,int offset,int length,String charsetName)
        msg = new String(datas,0,datas.length,"utf8");
        System.out.println(msg);
    }
}

以上例子以GBK进行编码,以utf8进行解码,编码与解码的字符集不统一,出现乱码
运行结果为

我对编程很感兴趣a
�ҶԱ�̺ܸ���Ȥa

②解码的字符数与编码的字符数不一样

public class Main {
    public static void main(String[] args) throws UnsupportedEncodingException {
        String msg = "我对编程很感兴趣";
        //编码,字节数组
        byte[] datas = msg.getBytes("GBK");  //字符串转字节,是编码的过程;其中getBytes()方法没有指明编码的格式所以默认是工程编码;
        System.out.println(msg);

        //解码:字符串String(byte[] bytes,int offset,int length,String charsetName)
        msg = new String(datas,0,datas.length-1,"GBK");
        System.out.println(msg);
    }
}

输出结果为

我对编程很感兴趣
我对编程很感兴�

虽然都是以“GBK”的方式进行编码与解码,但是由于解码长度影响了最后一个字符的解码
(注意:utf-8编码中一个中文字符占3个字节
一个字母占一个字节。而GBK编码方式中一个中文字符占2个字节,一个字母占一个字节。)

觉得还可以的小伙伴可以点个赞再离开啦!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值