一、字符流介绍
1.概述
字符流=字节流+编码表。因为字节流对于汉字之类的处理很不方便,汉字在通过任何的编码存储时,都会占用两个及以上字节,且第一个字节为负数,因此java提供了字符流来更方便的解决此类问题。(字符流只能处理文本文件)。
2. 什么是字符流
- 字符流是可以直接读写字符的IO流
- 使用字符流从文件中读取字符时, 需要先读取到字节数据, 然后转为字符.
- 使用字符流往文件写入字符时, 需要把字符转为字节再写入文件.
3.中文的字节存储方式
用字节流复制文本文件时,文本文件也会有中文,但是没有问题,原因是最终底层操作会自动进行字节拼接成中文,如何识别是中文的呢?
汉字在存储的时候,无论选择哪种编码存储,第一个字节都是负数
二、编码表
1.字符集
是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等
计算机要准确的存储和识别各种字符集符号,就需要进行字符编码,一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBXXX字符集、Unicode字符集等
2.常见字符集
1)ASCII字符集
ASCII:是基于拉丁字母的一套电脑编码系统,用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号) ;基本的ASCII字符集,使用7位表示一个字符,共128字符。ASCII的扩展字符集使用8位表示一个字符,共256字符,方便支持欧洲常用字符。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等
2)GBXXX字符集
GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩汉字等
3)Unicode字符集
UTF-8编码:可以用来表示Unicode标准中任意字符,它是电子邮件、网页及其他存储或传送文字的应用 中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。它使用一至四个字节为每个字符编码
编码规则:
128个US-ASCII字符,只需一个字节编码;拉丁文等字符,需要二个字节编码;大部分常用字(含中文),使用三个字节编码(UTF-8使用三个字节表示一个汉字);其他极少使用的Unicode辅助字符,使用四字节编码
三、字符流的解码和编码
1.字符串中的解码和编码:
1)编码
byte[] getBytes() : 将String转换为字节数组;
byte[] getBytes(String charsetName) : 通过指定的字符集将String转换为字节数组;
2)解码
String( byte[] bytes) : 将指定字节数组转换为String;
String( byte[] bytes,String charsetName) : 通过指定的字符集将字节数组转换为String;
public class StringDemo {
public static void main(String[] args) throws UnsupportedEncodingException {
//定义一个字符串
String s = "数字";
//byte[] bys = s.getBytes(); //[-28, -72, -83, -27, -101, -67]
//byte[] bys = s.getBytes("UTF-8"); //[-28, -72, -83, -27, -101, -67]
byte[] bys = s.getBytes("GBK"); //[-42, -48, -71, -6]
System.out.println(Arrays.toString(bys));
//String ss = new String(bys);
//String ss = new String(bys,"UTF-8");
String ss = new String(bys,"GBK");
System.out.println(ss);
}
}
2.字符流中的解码与编码
1)字符流抽象基类
-
Reader:字符输入流的抽象类
-
Writer:字符输出流的抽象类
2)字符流中和编码解码问题相关的两个类
InputStreamReader: 是从字节流到字符流的桥梁
它读取字节,并使用指定的编码将其解码为字符
它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集
OutputStreamWriter: 是从字符流到字节流的桥梁
是从字符流到字节流的桥梁,使用指定的编码将写入的字符编码为字节
它使用的字符集可以由名称指定,也可以被明确指定,或者可以接受平台的默认字符集
构造方法:
InputStreamReader(InputStream in) 使用默认字符编码创建InputStreamReader对象
InputStreamReader(InputStream in,String chatset) 使用指定的字符编码创建InputStreamReader对象
OutputStreamWriter(OutputStream out) 使用默认字符编码创建OutputStreamWriter对象
OutputStreamWriter(OutputStream out,String charset) 使用指定的字符编码创建OutputStreamWriter对象
代码示例:
public class ConversionStreamDemo {
public static void main(String[] args) throws IOException {
//OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("myCharStream\\osw.txt"));
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("myCharStream\\osw.txt"),"GBK");
osw.write("数字");
osw.close();
//InputStreamReader isr = new InputStreamReader(new FileInputStream("myCharStream\\osw.txt"));
InputStreamReader isr = new InputStreamReader(new FileInputStream("myCharStream\\osw.txt"),"GBK");
//一次读取一个字符数据
int ch;
while ((ch=isr.read())!=-1) {
System.out.print((char)ch);
}
isr.close();
}
}
四、读与写数据方式
1.字符流写数据的5种方式
1)方法
方法名 | 说明 |
void write(int c) | 写一个字符 |
void write(char[] cbuf) | 写入一个字符数组 |
void write(char[] cbuf, int off, int len) | 写入字符数组的一部分 |
void write(String str) | 写一个字符串 |
void write(String str, int off, int len) | 写一个字符串的一部分 |
注意:进行写字符时候,是因为其中是通过OutputStreamWriter中字符缓冲区中去,所以需要对进行刷新流,存在于FileOutputStream里进行操作。
2)刷新和关闭的方法
字符流需要注意的一个点是它每写一次数据需要调用flush方法刷新,这样才能在文件中看到数据。如果忘记刷新了也不用担心,调用close方法关闭流之前系统会自动刷新一次。
方法名 | 说明 |
flush() | 刷新流,之后还可以继续写数据 |
close() | 关闭流,释放资源,但是在关闭之前会先刷新流;一旦关闭,就不能再写数据 |
代码演示:
public class OutputStreamWriterDemo {
public static void main(String[] args) throws IOException {
OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("当前模块名\\xxx.txt"));
//void write(int c)://写一个字符
osw.write(97);
osw.write(98);
osw.write(99);
//void writ(char[] cbuf)://写入一个字符数组
char[] chs = {'a', 'b', 'c', 'd', 'e'};
osw.write(chs);
//void write(char[] cbuf, int off, int len):写入字符数组的一部分
osw.write(chs, 0, chs.length);
osw.write(chs, 1, 3);
//void write(String str):写一个字符串
osw.write("abcde");
//void write(String str, int off, int len):写一个字符串的一部分
osw.write("abcde", 0, "abcde".length());
osw.write("abcde", 1, 3);
//释放资源
osw.close();
}
}
2.读数据的两种方式
方法名 | 说明 |
int read() | 一次读一个字符数据 |
int read(char[] cbuf) | 一次读一个字符数组数据 |
例:
public class InputStreamReaderDemo {
public static void main(String[] args) throws IOException {
InputStreamReader isr = new InputStreamReader(new FileInputStream("myCharStream\\ConversionStreamDemo.java"));
//int read():一次读一个字符数据
// int ch;
// while ((ch=isr.read())!=-1) {
// System.out.print((char)ch);
// }
//int read(char[] cbuf):一次读一个字符数组数据
char[] chs = new char[1024];
int len;
while ((len = isr.read(chs)) != -1) {
System.out.print(new String(chs, 0, len));
}
//释放资源
isr.close();
}
}
五、字符缓冲流
1.概述
其中字节流跟字符流差不多道理,作为缓冲区,来提高效率,但实际操作都是通过字符流的Read类和Wirter类进行。
2.方法
1)BufferedWriter:
void newLine():写一行行分隔符,行分隔符字符串由系统属性定义
2)BufferedReader:
publicString readLine():读一行文字。结果包含行的内容的字符串,不包括任何行终止字符,如果流的结尾已经到达,则为null
3.构造方法
BufferedWriter(Writer out) 创建字符缓冲输出流对象
BufferedReader(Reader in) 创建字符缓冲输入流对象
代码示例:
public class BufferedStreamDemo01 {
public static void main(String[] args) throws IOException {
//BufferedWriter(Writer out)
BufferedWriter bw = new BufferedWriter(new FileWriter("myCharStream\\bw.txt"));
bw.write("hello\r\n");
bw.write("world\r\n");
bw.close();
//BufferedReader(Reader in)
BufferedReader br = new BufferedReader(new FileReader("myCharStream\\bw.txt"));
//一次读取一个字符数据
int ch;
while ((ch=br.read())!=-1) {
System.out.print((char)ch);
}
//一次读取一个字符数组数据
char[] chs = new char[1024];
int len;
while ((len=br.read(chs))!=-1) {
System.out.print(new String(chs,0,len));
}
br.close();
}
}
4.字符缓冲流:
1)BufferedWriter
将文本写入字符输出流,缓冲字符,以提供单个字符,数组和字符串的高效写入,可以指定缓冲区大小,或者可以接受默认大小。默认值足够大,可用于大多数用途
2)BufferedReader
从字符输入流读取文本,缓冲字符,以提供字符,数组和行的高效读取,可以指定缓冲区大小,或者可以使用默认大小。默认值足够大,可用于大多数用途
六、字符输出(Write)、输入(Reader)流
1.字符输出流
java.io.Writer类,抽象类,用于表示字符输出流的所有类的超类,将指定的字符信息写出到目的地
1)概述
java.io.FileWriter类 是Writer的子类,表示字符输出流,可以用来写出字符数据
2) 构造方法:
- public FileWriter(String fileName)
- public FileWriter(String fileName, boolean append)
- public FileWriter(File file)
- public FileWriter(File file, boolean append)
例:
FileWriter fw1 = new FileWriter("day12_File类与递归&IO流&字符流和字节流\\resources\\a.txt");
FileWriter fw2 = new FileWriter(new File("day12_File类与递归&IO流&字符流和字节流\\resources\\a.txt"));
FileWriter fw3 = new FileWriter("day12_File类与递归&IO流&字符流和字节流\\resources\\a.txt",true);
FileWriter fw4 = new FileWriter(new File("day12_File类与递归&IO流&字符流和字节流\\resources\\a.txt"),true);
3)注意:
<1>当你创建一个字符输出流对象时,必须传入一个文件路径
<2>前面2个构造方法,传入的路径,如果没有这个文件,会创建这个文件,如果文件里面有数据,数据会被清空
<3>后面2个构造方法,多了一个append的参数,true表示不清空,false默认清空
4)成员方法:
- public void write(int c)
- public void write(char cbuf[])
- public abstract void write(char cbuf[], int off, int len)
- public void write(String str)
- public void write(String str, int off, int len)
- public abstract void flush()
- public abstract void close()
2.字符输入流
java.io.Reader类:抽象类,表示用于读取字符流的所有类的超类,可以读取字符信息到内存中
1) 概述
java.io.FileReade类,继承Reader类,表示字符输入流,用来读取字符数据对象
2) 构造方法
public FileReader(String fileName):FileReader类对象,给定要读取的文件的名称
public FileReader(File file):FileReader类对象,给定要读取的file文件的名称
3) 成员方法
public abstract void close():关闭此流并释放与此流相关的任何系统资源
public int read():从输入流读取一个字符,读取到末尾返回 -1
public int read(char cbuf[]):从输入流中读取一些数据,并将它们存储到字符数组cbuf中
4)代码演示
<1>构造方法
// 文件真实存在
FileReader fr1 = new FileReader("day12_File类与递归&IO流&字符流&字节流\\resources\\a.txt");
// 文件不存在,会报出异常
FileReader fr2 = new FileReader("day12_File类与递归&IO流&字符流&字节流\\resources\\a.txt");
<2>读取单个字符数据
// 创建字符输入流对象
FileReader fr1 = new FileReader("day12_File类与递归&IO流&字符流&字节流\\resources\\a.txt");
int len;
// 循环读取
while ((len = fr1.read()) != -1){
System.out.print((char) len);
}
//关闭
fr1.close();
<3>读取字符的数组长度的字符数据
// 创建字符输入流对象
FileReader fr1 = new FileReader("day12_File类与递归&IO流&字符流和字节流\\resources\\a.txt");
int len;// 每次读取返回的字符数据
char[] chars = new char[1024];
// 循环读取
while( (len = fr1.read(chars)) != -1 ){
System.out.print(new String(chars,0,len));
}
// 关闭流
fr1.close();
七、字节流和字符流的区别
1.字节流每次读取一个字节,字符流每次读取一个字符,不管那个字符是中文英文,每次都读取一个字符。所以用 字符流 读取中文可以避免乱码。
2.字节流在操作时本身不会用到缓冲区,是文件本身直接操作的;而字符流在操作时使用了缓冲区,通过缓冲区再操作文件。
3.字节流和字符流之间是通过转换流进行转换的(InputStreamReader类是从字节输入流获得数据,然后转换为字符数据交给程序使用;OutputStreamWrite类是将程序输出的字符数据,先转换为字节数据后,再写到输出流中。)
4.从字节流转化为字符流时,实际上就是byte[]转化为String;字符流转化为字节流时,实际上是String转化为byte[]