java 字符编码转换

一、什么是字符编码

字符编码是将字符转换为二进制数字的过程,用于计算机的输入、输出和存储。在Java中,字符编码是使用Java编程语言中的Unicode字符集进行处理的。Unicode字符集是一个标准的字符集,它为世界上的每个字符分配了一个唯一的编号,包括拉丁字母、汉字、日语假名等等。

Java的Unicode字符集使用UTF-16编码方案,UTF-16是Unicode字符集中的一种编码方式,它将一个字符编码为一个或两个16位的代码单元。因此,Java的字符类型char在内存中占据两个字节的空间。

二、字符编码的类型

在Java中,常见的字符编码类型有以下几种:

ASCII编码

ASCII编码是一种最早的字符编码,它使用7位二进制数表示128个字符,包括英文字母、数字、标点符号和控制字符等。在ASCII编码中,每个字符都有一个唯一的二进制代码,可以在计算机中进行传输和存储。

ISO-8859-1编码

ISO-8859-1编码是一种使用8位二进制数表示字符,它可以表示256个字符,包括西欧语言中的字符和一些特殊字符。在Java中,默认使用ISO-8859-1编码表示字节流和网络数据。

Unicode编码

Unicode编码是一个标准的字符集,它为世界上的每个字符分配了一个唯一的编号,包括拉丁字母、汉字、日语假名等等。在Java中,Unicode编码可以使用字符串类型来表示。

UTF-8编码

UTF-8编码是一种可变长度编码方式,它可以根据字符的不同采用1-4个字节的编码方式,因此它可以表示Unicode字符集中的所有字符。在Java中,UTF-8编码可以使用字符串类型来表示。

转换案例

public class CodeDemo {
    public static void main(String[] args) {
        String info ="学习字符转换";
            //通常乱码的情况是 两个不兼容的编码相互转换

            //UTF_8 转 iso-8859-1   iso-8859-1不兼容中文 会乱码
            String s = new String(info.getBytes(StandardCharsets.UTF_8), StandardCharsets.ISO_8859_1);
            System.out.println(s);
            // iso-8859-1 转 UTF_8
            String strInfo = new String(s.getBytes(StandardCharsets.ISO_8859_1), StandardCharsets.UTF_8);
            System.out.println(strInfo);

    }
}
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

荷逸同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值