Java IO流之转换流、异常捕获:InputStreamReader、OutputStreamWriter


一、转换流

转换流是InputStreamReader、OutputStreamWriter,他们的父类分别是Reader、Writer。转换流的作用就是将字节按照指定的编码规则进行解码或编码。


1、字符编码和字符集

字符编码:

计算机中存储的信息都是二进制的,而我们见到的文字等都是二进制数转换之后的结果。按照这种规则,将字符存储到计算机中,称之为编码。反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称之为解码。编码和解码要是同一种规则,才会正常显示,不然会乱码。

编码:字符 --> 字节

解码:字节 --> 字符

  • 字符编码:就是一套自然语言的字符与二进制数之间的对应规则关系。

字符集:

  • 字符集:也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。

常见字符集:Unicode字符集、GBK字符集、ACSII字符集

在这里插入图片描述

ASCII字符集是最基础的编码,正数一个字节存储0-127个字符。

GBK字符集,GB(国标),用2个字节存储汉字。有GB2312、GBK、GB18030存储的汉字从少到多。各个编码一个字存储的字节不同。

Unicode字符集,其中UTF-8通用切常用字符集,一个汉字3个字节。


2、InputStreamReader 类

父类为Reader抽象类,拥有父类所有的共性方法。

java.io.InputStreamReader可以读取以该文本的编码规则读取该文本的内容,以达到正确读取该文本,不出现乱码情况。

读取的字节,以某种编码规则进行解码或编码。

构造方法

一共4个

  • public InputStreamReader(InputStream in)创建一个使用系统默认字符编码的InputStreamReader
  • public InputStreamReader(InputStream in,String charsetName) throws UnsupportedEncodingException创建一个指定字符集的InputStreamReader (参数charsetName不区分大小写)
public class InReaderTest {
    public static void main(String[] args) throws IOException {
        read_utf_8();
        read_gbk();
    }

    public static void read_utf_8() throws IOException {
        InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("utf_8.txt"),"utf-8");
        char[] ch = new char[1024];
        int len;
        while ((len = inputStreamReader.read(ch)) != -1){
            System.out.println(new String(ch,0,len));
        }
    }

    // 以gbk的形式读取gbk编码的文本,然后解析之后向控制台输出系统默认的utf-8编码的文本
    public static void read_gbk() throws IOException{
        InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("gbk.txt"),"GBK");
        char[] ch = new char[1024];
        int len;
        while ((len = inputStreamReader.read(ch)) != -1){
            System.out.println(new String(ch,0,len));
        }
    }
}

3、OutputStreamWriter 类

父类为Writer抽象类,拥有父类所有的共性方法。

java.io.InputStreamWriter以指定的编码规则,编码文本到硬盘文件中。

写入的字节,以某种编码规则进行解码或编码。

构造方法

一共4个

  • public OutputStreamWriter(OutputStream out)创建一个使用系统默认字符编码的OutputStreamWriter
  • public OutputStreamWriter(OutputStream out,String charsetName) throws UnsupportedEncodingException创建一个指定字符集的OutputStreamWriter (参数charsetName不区分大小写)
public class OutWriterTest {
    public static void main(String[] args) throws IOException {
        write_utf_8();
        write_gbk();
    }

    public static void write_utf_8() throws IOException {
        // 不指定编码,默认为UTF-8
        //OutputStreamWriter outputStreamWriter = new OutputStreamWriter(new FileOutputStream("utf_8.txt"));
        OutputStreamWriter outputStreamWriter = new OutputStreamWriter(new FileOutputStream("utf_8.txt"),"utf-8");
        outputStreamWriter.write("你好我是utf-8编码");
        outputStreamWriter.flush();
        outputStreamWriter.close();
    }

    public static void write_gbk() throws IOException{
        OutputStreamWriter outputStreamWriter = new OutputStreamWriter(new FileOutputStream("gbk.txt"),"GBK");
        outputStreamWriter.write("你好我是GBK编码");
        outputStreamWriter.flush();
        outputStreamWriter.close();
    }
}

UTF-8一个中文3个字节,ASCII码里的符号都是一个字节;GBK一个中文2个字节,ASCII码里的符号都是一个字节


练习:转换文件编码

将GBK编码的文本文件,转换成UTF-8编码的文本文件

public class TransTest {
    public static void main(String[] args) throws IOException {
        trans();
    }

    private static void trans() throws IOException {
        InputStreamReader inputStreamReader = new InputStreamReader(new FileInputStream("gbk.txt"),"GBK");
        OutputStreamWriter outputStreamWriter = new OutputStreamWriter(new FileOutputStream("gbkToutf-8.txt"),"utf-8");
        
        char[] ch = new char[1024];
        int len = 0; // 读取到的有效字节个数
        while ((len = inputStreamReader.read(ch)) != -1){
            outputStreamWriter.write(ch,0,len);
            outputStreamWriter.flush();
        }
        
        outputStreamWriter.close();
        inputStreamReader.close();
    }
}

二、IO流的异常捕获


1、JDK 7之前使用try catch finally捕获异常

public class Test {
    public static void main(String[] args) {
        // 因为在try代码块中定义输出流变量,finally代码块不能使用try代码块中的变量,作用域问题,因此提高变量作用域,代码块外定义,又因为在外定义有需要赋初始值,所以赋值null
        FileOutputStream fileOutputStream = null;
        try{
            fileOutputStream = new FileOutputStream("a.txt");
            fileOutputStream.write(48);
        }catch (IOException e){
            System.out.println("输出流IO异常");
        }finally {
            // 判断输出流是否为null,如果不判断如果为null,会报出异常NullPointerException
            if(fileOutputStream != null){
                try{
                    fileOutputStream.close();
                }catch (IOException e){
                    System.out.println("Close的IO异常");
                }
            }
        }
    }
}

2、JDK 7捕获异常新特性

public class CatchTest {
    public static void main(String[] args) {
        // try() 括号中定义流,当流有异常会自动释放
       try(FileOutputStream fileOutputStream = new FileOutputStream("a.txt")){
           fileOutputStream.write(48);
       }catch (IOException e){
           System.out.println("输出流IO异常");
       }
    }
}

3、JDK 9捕获异常新特性

public class CatchTest {
    public static void main(String[] args) throws IOException{
       
        FileOutputStream fileOutputStream = new FileOutputStream("a.txt");
        
        try(fileOutputStream){
            fileOutputStream.write(48);
        }catch (IOException e){
            System.out.println("输出流IO异常");
        }
        
    }
}

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java IO流学习总结 Java操作有关的类或接口: Java类图结构: 的概念和作用 是一组有顺序的,有起点和终点的字节集合,是对数据传输的总称或抽象。即数据在两设备间的传输称为的本质是数据传输,根据数据传输特性将抽象为各种类,方便更直观的进行数据操作。 IO流的分类 根据处理数据类型的不同分为:字符和字节 根据数据向不同分为:输入和输出 字符和字节 字符的由来: 因为数据编码的不同,而有了对字符进行高效操作的对象。本质其实就是基于字节读取时,去查了指定的码表。 字节和字符的区别: 读写单位不同:字节以字节(8bit)为单位,字符以字符为单位,根据码表映射字符,一次可能读多个字节。 处理对象不同:字节能处理所有类型的数据(如图片、avi等),而字符只能处理字符类型的数据。 结论:只要是处理纯文本数据,就优先考虑使用字符。 除此之外都使用字节。 输入和输出 对输入只能进行读操作,对输出只能进行写操作,程序中需要根据待传输数据的不同特性而使用不同的Java IO流对象 1.输入字节InputStreamIO 中输入字节的继承图可见上图,可以看出: InputStream 是所有的输入字节的父类,它是一个抽象类。 ByteArrayInputStream、StringBufferInputStream、FileInputStream 是三种基本的介质,它们分别从Byte 数组、StringBuffer、和本地文件中读取数据。PipedInputStream 是从与其它线程共用的管道中读取数据,与Piped 相关的知识后续单独介绍。 ObjectInputStream 和所有FilterInputStream 的子类都是装饰(装饰器模式的主角)。 2.输出字节OutputStream IO 中输出字节的继承图可见上图,可以看出: OutputStream 是所有的输出字节的父类,它是一个抽象类。 ByteArrayOutputStream、FileOutputStream 是两种基本的介质,它们分别向Byte 数组、和本地文件中写入数据。PipedOutputStream 是向与其它线程共用的管道中写入数据, ObjectOutputStream 和所有FilterOutputStream 的子类都是装饰。 3.字节的输入与输出的对应 图中蓝色的为主要的对应部分,红色的部分就是不对应部分。紫色的虚线部分代表这些一般要搭配使用。从上面的图中可以看出Java IO 中的字节是极其对称的。“存在及合理”我们看看这些字节中不太对称的几个类吧! LineNumberInputStream 主要完成从中读取数据时,会得到相应的行号,至于什么时候分行、在哪里分行是由改类主动确定的,并不是在原始中有这样一个行号。在输出部分没有对应的部分,我们完全可以自己建立一个LineNumberOutputStream,在最初写入时会有一个基准的行号,以后每次遇到换行时会在下一行添加一个行号,看起来也是可以的。好像更不入了。 PushbackInputStream 的功能是查看最后一个字节,不满意就放入缓冲区。主要用在编译器的语法、词法分析部分。输出部分的BufferedOutputStream 几乎实现相近的功能。 StringBufferInputStream 已经被Deprecated,本身就不应该出现在InputStream 部分,主要因为String 应该属于字符的范围。已经被废弃了,当然输出部分也没有必要需要它了!还允许它存在只是为了保持版本的向下兼容而已。 SequenceInputStream 可以认为是一个工具类,将两个或者多个输入当成一个输入依次读取。完全可以从IO 包中去除,还完全不影响IO 包的结构,却让其更“纯洁”――纯洁的Decorator 模式。 PrintStream 也可以认为是一个辅助工具。主要可以向其他输出,或者FileInputStream 写入数据,本身内部实现还是带缓冲的。本质上是对其它的综合运用的一个工具而已。一样可以踢出IO 包!System.out 和System.out 就是PrintStream 的实例! 4.字符输入Reader 在上面的继承关系图中可以看出: Reader 是所有的输入字符的父类,它是一个抽象类。 CharReader、StringReader 是两种基本的介质,它们分别将Char 数组、String中读取数据。PipedReader 是从与其它线程共用的管道中读取数据。 BufferedReader 很明显就是一个装饰器,它和其子类负责装饰其它Reader 对象。 FilterReader 是所有自定义具体装饰的父类,其子类PushbackReader 对Reader 对象进行装饰,会增加一个行号。 InputStreamReader 是一个连接字节和字符的桥梁,它将字节转变为字符。FileReader 可以说是一个达到此功能、常用的工具类,在其源代码中明显使用了将FileInputStream 转变为Reader 的方法。我们可以从这个类中得到一定的技巧。Reader 中各个类的用途和使用方法基本和InputStream 中的类使用一致。后面会有Reader 与InputStream 的对应关系。 5.字符输出Writer 在上面的关系图中可以看出: Writer 是所有的输出字符的父类,它是一个抽象类。 CharArrayWriter、StringWriter 是两种基本的介质,它们分别向Char 数组、String 中写入数据。PipedWriter 是向与其它线程共用的管道中写入数据, BufferedWriter 是一个装饰器为Writer 提供缓冲功能。 PrintWriter 和PrintStream 极其类似,功能和使用也非常相似。 OutputStreamWriterOutputStream 到Writer 转换的桥梁,它的子类FileWriter 其实就是一个实现此功能的具体类(具体可以研究一SourceCode)。功能和使用和OutputStream 极其类似,后面会有它们的对应图。 6.字符的输入与输出的对应 7.字符与字节转换 转换的特点: 其是字符和字节之间的桥梁 可对读取到的字节数据经过指定编码转换成字符 可对读取到的字符数据经过指定编码转换成字节 何时使用转换? 当字节和字符之间有转换动作时; 操作的数据需要编码或解码时。 具体的对象体现: InputStreamReader:字节到字符的桥梁 OutputStreamWriter:字符到字节的桥梁 这两个对象是字符体系中的成员,它们有转换作用,本身又是字符,所以在构造的时候需要传入字节对象进来。 8.File类 File类是对文件系统中文件以及文件夹进行封装的对象,可以通过对象的思想来操作文件和文件夹。 File类保存文件或目录的各种元数据信息,包括文件名、文件长度、最后修改时间、是否可读、获取当前文件的路径名,判断指定文件是否存在、获得当前目录中的文件列表,创建、删除文件和目录等方法。 9.RandomAccessFile类 该对象并不是体系中的一员,其封装了字节,同时还封装了一个缓冲区(字符数组),通过内部的指针来操作字符数组中的数据。 该对象特点: 该对象只能操作文件,所以构造函数接收两种类型的参数:a.字符串文件路径;b.File对象。 该对象既可以对文件进行读操作,也能进行写操作,在进行对象实例化时可指定操作模式(r,rw) 注意:该对象在实例化时,如果要操作的文件不存在,会自动创建;如果文件存在,写数据未指定位置,会从头开始写,即覆盖原有的内容。 可以用于多线程下载或多个线程同时写数据到文件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值