【JavaSE】Java文字的编码与解码

Unicode码表:

unicode (又称统一码、万国码、单一码)是计算机科学领域里的一项业界字符编码标准。
容纳世界上大多数国家的所有常见文字和符号。
由于Unicode会先通过UTF-8,UTF-16,以及UTF-32的编码成二进制后再存储到计算机,其中最为常见的就是UTF-8。

注意:

Unicode是万国码,以UTF-8编码后一个中文一般以三个字节的形式存储。
UTF-8也要兼容ASCII编码表。
技术人员都应该使用UTF-8的字符集编码。
编码前和编码后的字符集需要一致,否则会出现中文乱码。

 

编码和解码

package d3_charset;

import java.io.UnsupportedEncodingException;
import java.nio.charset.StandardCharsets;
import java.util.Arrays;

public class Test {
    public static void main(String[] args) throws Exception {
        //1.编码:把文字转换成字节(指定的编码)
        String name = "hhh,好厉害哟!";

        byte[] bytes1 = name.getBytes(StandardCharsets.UTF_8);//以当前代码默认字符集进行编码(UTF-8)
        System.out.println(bytes1.length);
        System.out.println(Arrays.toString(bytes1));

        byte[] bytes2 = name.getBytes("GBK");//指定编码
        System.out.println(bytes2.length);
        System.out.println(Arrays.toString(bytes2));

        //2.解码:把字节转换成对应的中文形式(编码前和编码后的字符集必须一致,否则乱码)
        String rs1 = new String(bytes1);//默认的UTF-8
        System.out.println(rs1);

        String rs2 = new String(bytes2,"GBK");//指定GBK解码
        System.out.println(rs2);
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

iknow181

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值