Java—— IO流 第二期

计算机存储说明

在计算机中,任意数据都是以二进制的形式来存储的
计算机中最小的存储单元是一个字节

常用的字符集

1.ASCII字符集:基于拉丁字母的字符编码,共收录 128 个字符,用一个字节就可以存储。
2.GBK字符集:兼容ASCII并收录21003个汉字,包含国家标准GB13000-1中的全部中日韩汉字,和BIG5编码中的所有汉字。windows系统默认使用的就是GBK,系统显示:ANSI。
3. Unicode字符集:国际标准字符集,又称万国码,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换。

计算机存储规则

ASCII字符集存储规则

GBK字符集存储规则

英文

中文 

细节:

根据GBK编码规则,英文的码都是0开头且占一个字节,汉字的码一定以1开头且占两个字节

所以看到0开头的一个字节表示英文,看到1开头的两个字节表示汉字

例如:

01100001  10011011  00010000  01100100

英文           汉字                            英文

Unicode字符集存储规则

UTF-8是Unicode字符集存储规则中的一种,最常使用

UTF-8编码规则

用1-4个字节存储数据,其中ASCII码表上的符号用1个字节,简体中文用3个字节。

UTF-8编码固定格式
0XXXXXASCII码表上的符号
1110XXXX 10XXXXXX 10XXXXXX简体中文

其中红色部分是固定的,X部分根据不同字符对应不同数字的二进制进行填入

英文 

中文 

如何设定想要使用的字符集

Java中编码的方法

String类中的方法说明
byte[] getBytes()使用默认方式进行编码
byte[] getBytes(String charsetName)使用指定方式进行编码

Java中解码的方法

String类中的方法说明
new String(byte[] bytes)使用默认方式进行解码
new String(byte[] bytes,string charsetName)使用指定方式进行解码

代码演示

import java.io.UnsupportedEncodingException;
import java.util.Arrays;

public class Test1 {
    public static void main(String[] args) throws UnsupportedEncodingException {

        String str1 = new String("ai爱");

        //进行编码

        //idea默认使用UTF-8,英文占1个字节,中文占3个字节
        //所以字节数组应该有5个数据
        byte[] b1 = str1.getBytes();
        System.out.println(Arrays.toString(b1));
        //[97, 105, -25, -120, -79]

        //传参使用GBK,英文占1个字节,中文占2个字节
        //所以字节数组应该有4个数据
        byte[] b2 = str1.getBytes("GBK");
        System.out.println(Arrays.toString(b2));
        //[97, 105, -80, -82]


        //进行解码
        //用什么字符集编码就要用什么字符集解码,否则会出现乱码

        //默认UTF-8编码,默认UTF-8解码
        String str2 = new String(b1);
        System.out.println(str2);//ai爱

        //传参使用GBK编码,传参使用GBK解码
        String str3 = new String(b2, "GBK");
        System.out.println(str3);//ai爱

    }
}

字节流的局限性

字节流一次只能读取一个字节,而中文是用多个字节表示的,所以使用字节流读取中文时会出现乱码,因此需要使用字符流

字符流

字符流的底层其实就是字节流
字符流 = 字节流 + 字符集
特点:
字符输入流:一次读一个字节,遇到中文时,一次读多个字节
字符输出流:底层会把数据按照指定的编码方式进行编码,变成字节再写到文件中
使用场景:
对于纯文本文件进行读写操作

字符流的实现类

操作本地文件的字符输入流FileReader

创建字符输入流对象
构造方法说明
public FileReader(File file)创建字符输入流关联本地文件
public FileReader(String pathname)创建字符输入流关联本地文件

细节:如果文件不存在,就直接报错。 

读取数据
成员方法说明
public int read()读取数据,读到末尾返回-1
public int read(char[] buffer)读取多个数据,读到末尾返回-1

read()细节:
read()默认一个字节一个字节读取,如果遇到中文就会一次读取多个字节
在读取之后,方法的底层还会进行解码并转成十进制,最终把这个十进制作为返回值返回
这个十进制的数据表示该字符在字符集上对应的数字

例如:

英文:文件里面二进制数据0110 0001,read方法进行读取,解码并转成十进制97
中文:文件里面的二进制数据11100110 10110001 10001001,read方法进行读取,解码并转成十进制27721
再把这些十进制数据进行char强转就能看到对应的字符了

read(char[])细节:

返回的int类型的数据是读取到的字符个数

底层将读取数据,解码,强转三步合并了,把强转之后的字符存放到了传递的char数组当中

释放资源
成员方法说明
public int close()释放资源/关流 
代码演示

读取本模块下

import java.io.FileReader;
import java.io.IOException;

public class Test2 {
    public static void main(String[] args) throws IOException {

        FileReader fr = new FileReader("day04\\a.txt");

        int b;

        /*while ((b = fr.read()) != -1) {
            System.out.print(b + " ");
        }
        //20320 22909 74 97 118 97 21704 21704 */

        while ((b = fr.read()) != -1) {
            System.out.print((char) b + " ");
        }
        //你 好 J a v a 哈 哈 

        fr.close();
    }
}
import java.io.FileReader;
import java.io.IOException;

public class Test3 {
    public static void main(String[] args) throws IOException {

        FileReader fr = new FileReader("day04\\a.txt");

        int len;
        char[] ch = new char[3];
        while ((len = fr.read(ch)) != -1) {
            String str = new String(ch, 0, len);
            System.out.println(len + " " + str);
        }
        //3 你好J
        //3 ava
        //2 哈哈
        
        fr.close();

    }
}

操作本地文件的字符输出流FileWriter

创建字符输出流对象
构造方法说明
public FileWriter(File file)创建字符输出流关联本地文件
public FileWriter(String pathname)创建字符输出流关联本地文件
public FileWriter(File file, boolean append)创建字符输出流关联本地文件,是否续写
public FileWriter(String pathname, boolean append)创建字符输出流关联本地文件,是否续写

细节1:参数是字符串表示的路径或者File对象
细节2:如果文件不存在会创建一个新的文件,但是要保证父级路径是存在的
细节3:如果文件已经存在,则会清空文件,如果不想清空可以打开续写开关

写数据
成员方法说明
void write(int c)写出一个字符
void write(String str)写出一个字符串
void write(String str, int off, int len)写出一个字符串的一部分
void write(char[] cbuf)写出一个字符数组
void write(char[] cbuf, int off, int len)写出字符数组的一部分

细节:如果write方法的参数是整数,但是实际上写到本地文件中的是整数在字符集上对应的字符

释放资源
成员方法说明
public int close()释放资源/关流 

细节:每次使用完流之后都要释放资源 

代码演示
import java.io.FileWriter;
import java.io.IOException;

public class Test4 {
    public static void main(String[] args) throws IOException {

        FileWriter fw = new FileWriter("day04\\a.txt");

        fw.write(97);
        fw.write("你好");

        char[] ch = {'a','i','爱'};
        fw.write(ch);

        fw.close();

    }
}

缓冲区

与FileInputStream和FileOutputStream不同的是,FileReader和FileWriter底层具有缓冲区

创建FileReader和FileWriter对象
底层:关联文件,并创建缓冲区(长度为8192的字节数组)

注:FileReader和FileWriter的缓冲区不是同一个,各自使用各自的缓冲区

读数据FileReader

底层:

判断缓冲区中是否有数据可以读取
缓冲区没有数据:就从文件中获取数据,装到缓冲区中,每次尽可能装满缓冲区,如果文件中也没有数据了,返回-1
缓冲区有数据:就从缓冲区中读取。

写数据FileWriter

底层:

数据会先装到缓冲区中,缓冲区数据装满时,调用flush方法刷新时,调用close方法关流时,会将缓冲区中的数据加载到文件中

flush刷新:刷新之后,还可以继续往文件中写出数据
close关流: 断开通道,无法再往文件中写出数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值