编码 解码 乱码问题

1.编码/解码:
JVM里默认使用Unicode的编码方式,一个字符占用两个字节
而操作系统里可能是用的是GBK(Windows),UTF-8(Linux),或者ISO8859-1

String str="你好";
//编码: 字符--->字节  默认的是UTF-8---一个字符占用3个字节
//JVM使用的是Unicode编码 一个字符占用2个字节
//getBytes();-->得到的是数组
byte[] bs=str.getBytes();
System.out.println(Arrays.toString(bs));
//getBytes();--里手动指定一个字符集
byte[] bs1=str.getBytes("gbk");//此时使用的是给定的GBK方式编码
System.out.println(Arrays.toString(bs1));

//解码: 字节--->字符  bs是用默认的UTF-8编码的,所以也要用UTF-8解码
String s1=new String(bs);
System.out.println("s1:"+s1);
//bs1是用GBK编码的,所以要用GBK解码
String s2=new String(bs1,"gbk");
System.out.println("s2"+s2);

//用GBK方式给字符串s编码成字节b
String s="哈哈";
byte[] b=s.getBytes("gbk");
System.out.println(Arrays.toString(b));
//再用GBK方式给字节b解码成字符串ss
String ss=new String(b,"gbk");
System.out.println(ss);


2.乱码问题的解决:

String str="雷好啊";
byte[] bS=str.getBytes();//用默认UTF-8编码
String s=new String(bS,"ISO8859-1");   //用ISO8859-1解码--->形成了乱码
System.out.println(s);
//用ISO8859-1再进行编码,使其回到用ISO8859-1解码前的状态
byte[] b=s.getBytes("ISO8859-1");
String s1=new String(b,"UTF-8");//用正确方式UTF-8重新解码
System.out.println(s1);
//对以上三句的简写---常用  上面的三句通常不使用
s=new String(s.getBytes("ISO8859-1"));
System.out.println(s);

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值