Java中的字符流与编码表

最新推荐文章于 2023-07-18 19:44:34 发布

小天天666

最新推荐文章于 2023-07-18 19:44:34 发布

阅读量359

点赞数

文章标签： java 开发语言

本文链接：https://blog.csdn.net/gushendezhufu/article/details/121645976

版权

由于字节流操作中文不是特别的方便，所以Java就提供字符流

字符流 = 字节流 + 编码表

用字节流复制文本文件时，文本文件也会由中文，但是没有问题，原因是最底层操作会自动进行字节拼接成中文，然后识别是中文的呢？

汉字在存储的时候，无论选择哪种编码存储，第一个字节都是负数。

例：输出test1.txt的文本信息到控制台
在这里插入图片描述

FileInputStream fis = new FileInputStream("D:\\Software\\File\\test1.txt");

        int b;
        while((b = fis.read()) != -1){
            System.out.print((char)b);
        }

        fis.close();

控制台输出：

What's up!æ€Žä¹ˆäº†

用以下代码，就正常了

FileInputStream fis = new FileInputStream("D:\\Software\\File\\test1.txt");

        byte[] b = new byte[1024];
        int len;
        while((len = fis.read(b)) != -1){
            System.out.print(new String(b,0,len));
        }

        fis.close();

控制台输出：

What's up!怎么了

编码表

基础知识：

计算机中存储的信息都是用二进制数表示的；我们在屏幕4上看到的英文、汉字等字符是二进制数转换之后的结果
安装某种规则，将字符存储到计算机中，称为编码。反之，将存储在计算机中的二进制数按照某种规则解析显示出来，称为解码。这里强调一下：按照A编码存储，必须按照A编码解析，这样才能显示正确的文本符号。否则就会导致乱码现象

字符编码：就是一套自然语言的字符与二进制数之间的对应规则（A,65）

字符集

是一个系统支持的所有字符的集合，包括各国家文字、标点符号、图形符号、数字等。
计算机要准确的存储和识别各种字符集符号，就需要进行字符编码，一套字符集必然至少由一套字符编码。
常见字符集有ASCII字符集、GBXXX字符集、Unicode字符集等。

ASCII就不多介绍了。

GBK：最常用的中文码表。是在GB2312标准基础上的扩展规范，使用了双字节编码方案，共收录了21003个汉字，完全兼容GB2312标准，同时支持繁体汉字以及日韩汉字等

GB128030：最新的中文码表。收录汉字70244个，采用多字节编码，每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字，同时支持繁体汉字以及日韩汉字等

Unicode字符集

为表达任意语言的任意字符而设计，是业界的一种标准，也称为统一码、标准万国码。它最多使用4个字节的数字来表示每个字母、符号，或者文字。有三种编码方案，UTF-8、UTF-16和UTF32。最为常用UTF-8编码。
UTF-8编码：可以用来表示Unicode标准中任意字符，它是电子邮件、网页以及其他存储或传送文字的应用中，优先采用的编码。互联网工程小组（IETF）要求所有互联网协议都必须支持UTF-8编码。它使用一至四个字节为每个字符编码
编码规则：
128个US-ASCII字符，只需一个字节编码
拉丁文等字符，需要二个字节编码
大部分常用字（含汉字），使用三个字节编码
其他极少使用的Unicode辅助字符，使用四个字节编码

采用何种规则编码，就要采用对应规则解码，否则就会出现乱码

小天天666

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Java中的字符流与编码表

由于字节流操作中文不是特别的方便，所以Java就提供字符流字符流 = 字节流 + 编码表用字节流复制文本文件时，文本文件也会由中文，但是没有问题，原因是最底层操作会自动进行字节拼接成中文，然后识别是中文的呢？汉字在存储的时候，无论选择哪种编码存储，第一个字节都是负数。例：输出test1.txt的文本信息到控制台FileInputStream fis = new FileInputStream("D:\\Software\\File\\test1.txt"); int b
复制链接

扫一扫