Java中IO流（字符流）

最新推荐文章于 2024-04-12 20:00:21 发布

程果果.

最新推荐文章于 2024-04-12 20:00:21 发布

阅读量618

点赞数 2

文章标签： servlet

本文链接：https://blog.csdn.net/weixin_73656077/article/details/128304933

版权

本文详细介绍了Java中的字符流，包括字符流的概念、编码表、字符流的解码与编码，以及读写数据的方式。重点讲解了ASCII、GBXXX和Unicode字符集，探讨了字符缓冲流BufferedReader和BufferedWriter的使用，同时对比了字符流与字节流的区别。

摘要由CSDN通过智能技术生成

一、字符流介绍

1.概述

字符流=字节流+编码表。因为字节流对于汉字之类的处理很不方便，汉字在通过任何的编码存储时，都会占用两个及以上字节，且第一个字节为负数，因此java提供了字符流来更方便的解决此类问题。(字符流只能处理文本文件)。

2. 什么是字符流

字符流是可以直接读写字符的IO流
使用字符流从文件中读取字符时, 需要先读取到字节数据, 然后转为字符.
使用字符流往文件写入字符时, 需要把字符转为字节再写入文件.

3.中文的字节存储方式

用字节流复制文本文件时，文本文件也会有中文，但是没有问题，原因是最终底层操作会自动进行字节拼接成中文，如何识别是中文的呢？

汉字在存储的时候，无论选择哪种编码存储，第一个字节都是负数

二、编码表

1.字符集

是一个系统支持的所有字符的集合，包括各国家文字、标点符号、图形符号、数字等
计算机要准确的存储和识别各种字符集符号，就需要进行字符编码，一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBXXX字符集、Unicode字符集等

2.常见字符集

1）ASCII字符集

ASCII：是基于拉丁字母的一套电脑编码系统，用于显示现代英语，主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号) ；基本的ASCII字符集，使用7位表示一个字符，共128字符。ASCII的扩展字符集使用8位表示一个字符，共256字符，方便支持欧洲常用字符。是一个系统支持的所有字符的集合，包括各国家文字、标点符号、图形符号、数字等

2）GBXXX字符集

GBK：最常用的中文码表。是在GB2312标准基础上的扩展规范，使用了双字节编码方案，共收录了21003个汉字，完全兼容GB2312标准，同时支持繁体汉字以及日韩汉字等

3）Unicode字符集

UTF-8编码：可以用来表示Unicode标准中任意字符，它是电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。互联网工程工作小组（IETF）要求所有互联网协议都必须支持UTF-8编码。它使用一至四个字节为每个字符编码

编码规则：

128个US-ASCII字符，只需一个字节编码；拉丁文等字符，需要二个字节编码；大部分常用字（含中文），使用三个字节编码（UTF-8使用三个字节表示一个汉字）；其他极少使用的Unicode辅助字符，使用四字节编码

三、字符流的解码和编码

1.字符串中的解码和编码:

1）编码

byte[] getBytes() ：将String转换为字节数组；

byte[] getBytes(String charsetName) ：通过指定的字符集将String转换为字节数组；

2）解码

String( byte[] bytes) ：将指定字节数组转换为String;

String( byte[] bytes,String charsetName) ：通过指定的字符集将字节数组转换为String；

public class StringDemo {
    public static void main(String[] args) throws UnsupportedEncodingException {
        //定义一个字符串
        String s = "数字";
 
        //byte[] bys = s.getBytes(); //[-28, -72, -83, -27, -101, -67]
        //byte[] bys = s.getBytes("UTF-8"); //[-28, -72, -83, -27, -101, -67]
        byte[] bys = s.getBytes("GBK"); //[-42, -48, -71, -6]
        System.out.println(Arrays.toString(bys));
 
        //String ss = new String(bys);
        //String ss = new String(bys,"UTF-8");
        String ss = new String(bys,"GBK&