一、缓冲流
1.1、概述
缓冲流也叫高效流,是对最基本的FileInputStream、FileOutputStream、FileReader、FileWriter的增强,所以也是4个流,按照数据类型分为如下种类
- 字节缓冲流:BufferedInputStream、BufferedOutputStream
- 字符缓冲流:BufferedReader、BufferedWriter
缓冲流的基本原理是在创建流对象时,会创建一个内置的默认大小的缓冲区数组,通过缓冲区读写,减少系统IO次数,从而提高读写的效率。
1.2、字节缓冲流
1.2.1、构造方法
public BufferedInputStream(InputStream in)
public BufferedOutputStream(OutputStream out)
1.2.2、大文件拷贝
/**
* 使用 BufferedInputStream和BufferedOutputStream 演示大文件的拷贝
*/
@Test
public void copyBigFile() {
long start = System.currentTimeMillis();
BufferedInputStream bis = null;
BufferedOutputStream bos = null;
try {
bis = new BufferedInputStream(new FileInputStream("D:\\速度与激情9.mkv"));
bos = new BufferedOutputStream(new FileOutputStream("D:\\速度与激情9_copy.mkv"));
int len;
byte[] buf = new byte[8 * 1024];
while ((len = bis.read(buf)) != -1) {
bos.write(buf, 0, len);
}
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (bos != null) {
bos.close();
}
if (bis != null) {
bis.close();
}
} catch (Exception e) {
e.printStackTrace();
}
}
long end = System.currentTimeMillis();
System.out.println("耗时:" + (end - start) + " 毫秒");
}
1.3、字符缓冲流
1.3.1、构造方法
public BufferedReader(Reader in)
public BufferedWriter(Writer out)
# 创建字符缓冲输入流
BufferedReader br = new BufferedReader(new FileReader("br.txt"));
# 创建字符缓冲输出流
BufferedWriter bw = new BufferedWriter(new FileWriter("bw.txt"));
1.3.2、特有方法
# 读取一行文字
public String readLine();
# 写一行行分割符
public void newLine();
/**
* 测试 BufferedReader的readLine()方法
*/
@Test
public void readLineTest() throws IOException {
BufferedReader br = new BufferedReader(new FileReader("D:\\三国演义.txt"));
// 定义字符串,用来保存读取的一行文字
String lineData = null;
// 循环读取,读取到最后返回null
while ((lineData = br.readLine()) != null) {
System.out.print(lineData);
System.out.println("\r\n");
}
br.close();
}
/**
* 测试BufferedWriter的newLine()方法
*/
@Test
public void newLineTest() throws IOException {
BufferedWriter bw = new BufferedWriter(new FileWriter("红楼梦.txt"));
// 写出数据
bw.write("床前明月光");
// 写出换行
bw.newLine();
bw.write("疑是地上霜");
bw.newLine();
bw.close();
}
1.4、文本排序案例
# 需求:请将如下文本信息恢复排序
3.侍中、侍郎郭攸之、费祎、董允等,此皆良实,志虑忠纯,是以先帝简拔以遗陛下。愚以为宫中之事,事无大小,悉以咨之,然后施行,必得裨补阙漏,有所广益。
8.愿陛下托臣以讨贼兴复之效,不效,则治臣之罪,以告先帝之灵。若无兴德之言,则责攸之、祎、允等之慢,以彰其咎;陛下亦宜自谋,以咨诹善道,察纳雅言,深追先帝遗诏,臣不胜受恩感激。
4.将军向宠,性行淑均,晓畅军事,试用之于昔日,先帝称之曰能,是以众议举宠为督。愚以为营中之事,悉以咨之,必能使行阵和睦,优劣得所。
2.宫中府中,俱为一体,陟罚臧否,不宜异同。若有作奸犯科及为忠善者,宜付有司论其刑赏,以昭陛下平明之理,不宜偏私,使内外异法也。
1.先帝创业未半而中道崩殂,今天下三分,益州疲弊,此诚危急存亡之秋也。然侍卫之臣不懈于内,忠志之士忘身于外者,盖追先帝之殊遇,欲报之于陛下也。诚宜开张圣听,以光先帝遗德,恢弘志士之气,不宜妄自菲薄,引喻失义,以塞忠谏之路也。
9.今当远离,临表涕零,不知所言。
6.臣本布衣,躬耕于南阳,苟全性命于乱世,不求闻达于诸侯。先帝不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感激,遂许先帝以驱驰。后值倾覆,受任于败军之际,奉命于危难之间,尔来二十有一年矣。
7.先帝知臣谨慎,故临崩寄臣以大事也。受命以来,夙夜忧叹,恐付托不效,以伤先帝之明,故五月渡泸,深入不毛。今南方已定,兵甲已足,当奖率三军,北定中原,庶竭驽钝,攘除奸凶,兴复汉室,还于旧都。此臣所以报先帝而忠陛下之职分也。至于斟酌损益,进尽忠言,则攸之、祎、允之任也。
5.亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所以倾颓也。先帝在时,每与臣论此事,未尝不叹息痛恨于桓、灵也。侍中、尚书、长史、参军,此悉贞良死节之臣,愿陛下亲之信之,则汉室之隆,可计日而待也
/**
* 说明:文本排序案例演示
*/
@Test
public void sortFileTest() throws IOException {
ArrayList<String> list = new ArrayList<>();
BufferedReader br = new BufferedReader(new FileRead
BufferedWriter bw = new BufferedWriter(new FileWrit
String lineData;
while ((lineData = br.readLine()) != null) {
list.add(lineData);
}
Collections.sort(list, new Comparator<String>() {
/**
* o1 - o2 :升序
* o2 - o1 :降序
* @param o1 the first object to be compared.
* @param o2 the second object to be compared.
* @return
*/
@Override
public int compare(String o1, String o2) {
return o1.charAt(0) - o2.charAt(0);
}
});
for (String data : list) {
bw.write(data);
bw.newLine();
}
bw.close();
br.close();
}
二、转换流
2.1、字符编码和字符集
2.1.1、字符编码
计算机中储存的信息都是用二进制数表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。按照某种规则,将字符存储到计算机中,称为编码 。反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称为解码 。比如说,按照A规则存储,同样按照A规则解析,那么就能显示正确的文本符号。反之,按照A规则存储,再按照B规则解析,就会导致乱码现象。
编码:字符(能看懂的) ===> 字节(看不懂的)
解码:字节(看不懂的) ===> 字符(能看懂的)
字符编码:就是一套自然语言的字符与二进制数之间的对应规则
2.1.2、字符集
也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。计算机要准确的存储和识别各种字符集符号,需要进行字符编码,一套字符集必然至少有一套字符编码。常见字符集有ASCII字符集、GBK字符集、Unicode字符集等
ASCII字符集
ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)。
基本的ASCII字符集,使用7位(bits)表示一个字符,共128字符。ASCII的扩展字符集使用8位(bits)表示一个字符,共256字符,方便支持欧洲常用字符。
ISO-8859-1字符集
拉丁码表,别名Latin-1,用于显示欧洲使用的语言,包括荷兰、丹麦、德语、意大利语、西班牙语等。
ISO-8859-1使用单字节编码,兼容ASCII编码。
GBKXXX字符集
GB就是国标的意思,是为了显示中文而设计的一套字符集。
GB2312:简体中文码表。一个小于127的字符的意义与原来相同。但两个大于127的字符连在一起时,就表示一个汉字,这样大约可以组合了包含7000多个简体汉字,此外数学符号、罗马希腊的字母、日文的假名们都编进去了,连在ASCII里本来就有的数字、标点、字母都统统重新编了两个字节长的编码,这就是常说的"全角"字符,而原来在127号以下的那些就叫"半角"字符了。
GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了双字节编码方案,共收录了21003个汉字,完全兼容GB2312标准,同时支持繁体汉字以及日韩汉字等。
GB18030:最新的中文码表。收录汉字70244个,采用多字节编码,每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字,同时支持繁体汉字以及日韩汉字等。
Unicode字符集
Unicode编码系统为表达任意语言的任意字符而设计,是业界的一种标准,也称为统一码、标准万国码。
它最多使用4个字节的数字来表达每个字母、符号,或者文字。有三种编码方案,UTF-8、UTF-16和UTF-32。最为常用的UTF-8编码。
UTF-8编码,可以用来表示Unicode标准中任何字符,它是电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。所以,我们开发Web应用,也要使用UTF-8编码。它使用一至四个字节为每个字符编码,编码规则:
128个US-ASCII字符,只需一个字节编码。
拉丁文等字符,需要二个字节编码。
大部分常用字(含中文),使用三个字节编码。
其他极少使用的Unicode辅助字符,使用四字节编码
三、序列化
3.1、概述
Java提供了一种对象的序列化机制,用一个字节序列可以表示一个对象,该字节序列包含了对象的数据、对象的类型和对象中存储的属性等信息。字节序列写出到文件之后,相当于在磁盘中永久保存了一个对象的信息。反之,该字节序列还可以从序列化文件中重新读取回来,重构对象。
3.2、ObjectOutputStream
java.io.ObjectOutputStream类,用于将Java对象的原始数据类型写到到文件,实现对象的持久化存储。
3.2.1、构造方法
public ObjectOutputStream(OutputStream out)
3.2.2、序列化条件
一个对象想要实现序列化,需要满足如下两个条件:
(1)必须实现 java.io.Serializable 接口,该接口是一个标记接口,不实现此接口的类将无法序列化或者反序列化,会抛出
NotSerializableException
异常;(2)该类的所有属性必须是可序列化的,如果一个属性不需要序列化,则该属性必须注明是瞬态的,用 transient 关键字修饰;
3.2.3、序列化案例
@Data
@AllArgsConstructor
@NoArgsConstructor
@Accessors(chain = true)
public class EmployeeDTO implements Serializable {
private Integer id;
private String name;
private Integer age;
/**
* gender属性不需要序列化
*/
private transient String gender;
}
/**
* 序列化对象案例演示
*/
@Test
public void objectSerializableTest() {
EmployeeDTO employee = new EmployeeDTO(1,"张三",23,"男");
try {
// 创建序列化流对象
ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("employee_serial.txt"));
// 写出对象
oos.writeObject(employee);
// 释放资源
oos.close();
System.out.println("序列化success");
} catch (Exception e) {
e.printStackTrace();
}
}
3.3、ObjectInputStream
3.3.1、概述
java.io.ObjectInputStream,反序列化类,用于将ObjectOutputStream序列化后的数据恢复为对象。
3.3.2、构造方法
public ObjectInputStream(InputStream in)
3.3.3、反序列化案例
注意事项:
反序列化时,如果原始的Class文件发生了变化,例如新增加了属性,修改了属性的名称,那么反序列化操作也会失败,会抛出一个InvalidClassException异常,发生这个异常的原因如下:
(1)该类的序列版本号与从流中读取的类描述符的版本号不匹配
(2)该类包含未知数据类型
(3)该类没有可访问的无参数构造方法
Serializable
接口给需要序列化的类,提供了一个序列版本号。serialVersionUID
该版本号的目的在于验证序列化的对象和对应类是否版本匹配
/**
* 反序列化案例演示
*/
@Test
public void objectReSerializableTest() {
FileInputStream fis = null;
ObjectInputStream ois = null;
EmployeeDTO employeeDTO = null;
try {
fis = new FileInputStream("employee_serial.txt");
ois = new ObjectInputStream(fis);
employeeDTO = (EmployeeDTO) ois.readObject();
System.out.println(employeeDTO);
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (fis != null) {
fis.close();
}
if (ois != null) {
ois.close();
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
四、打印流
4.1、概述
平时我们在控制台打印输出,是调用print方法和println方法完成的,这两个方法都来自于java.io.PrintStream类,该类能够方便地打印各种数据类型的值,是一种便捷的输出方式。
4.2、PrintStream
4.2.1、构造方法
public PrintStream(String fileName)
4.2.2、改变流的打印方向案例
/**
* 改变流的打印方向,将控制台输出日志改为输出到指定文件
*/
@Test
public void testPrintStream() throws FileNotFoundException {
// 直接打印在控制台
System.out.println("床前明月光");
PrintStream printStream = new PrintStream("print_log.txt");
// 设置系统的打印流方向,输出到print_log.txt中
System.setOut(printStream);
System.out.println("床前明月光,疑是地上霜");
}
五、压缩流和解压缩流
5.1、压缩流
5.1.1、概述
用于压缩文件或者文件夹。
5.1.2、压缩文件案例
package org.star.zipstream;
import org.junit.Test;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.util.zip.ZipEntry;
import java.util.zip.ZipOutputStream;
public class Demo1_ZIPStream {
/**
* 需求:将 D:\\爱江山更爱美人.mp3 文件压缩
*/
@Test
public void zipFileTest() {
File srcFile = new File("D:\\爱江山更爱美人.mp3");
File destFile = new File("D:\\");
zipFile(srcFile,destFile);
System.out.println("压缩文件success");
}
/**
* 压缩文件
* @param srcFile 原始文件
* @param destFile 压缩后的文件地址
*/
public void zipFile(File srcFile, File destFile) {
ZipOutputStream zos = null;
try {
// 创建压缩流,关联压缩包
zos = new ZipOutputStream(new FileOutputStream(new File(destFile,"爱江山更爱美人.zip")));
// 参数:压缩包里边的路径
ZipEntry entry = new ZipEntry("歌曲\\李丽芬\\爱江山更爱美人.mp3");
// 把entry对象放到压缩包里面
zos.putNextEntry(entry);
// 把srcFile中的数据写到压缩包中
FileInputStream fis = new FileInputStream(srcFile);
int len;
byte[] buf = new byte[8 * 1024];
while ((len = fis.read(buf)) != -1) {
zos.write(buf,0,len);
}
} catch (Exception e) {
e.printStackTrace();
} finally {
try {
if (zos != null) {
zos.closeEntry();
zos.close();
}
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
5.1.3、压缩文件夹案例
/**
* 需求:将 D:\开源项目 文件夹压缩
*/
@Test
public void zipDirTest() {
File srcFile = new File("D:\\开源项目");
// 创建File对象,表示压缩包放在哪里(压缩包的父级路径)
File destParent = srcFile.getParentFile(); // D:\\
File destFile = new File(destParent, srcFile.getName() + ".zip");
ZipOutputStream zos = null;
try {
zos = new ZipOutputStream(new FileOutputStream(destFile));
zipDir(srcFile, zos, srcFile.getName());
} catch (FileNotFoundException e) {
e.printStackTrace();
} finally {
try {
if (zos != null) {
zos.closeEntry();
zos.close();
}
} catch (Exception e) {
e.printStackTrace();
}
}
System.out.println("文件夹压缩success");
}
/**
* 压缩文件夹
*
* @param srcFile
* @param zos
* @param name
*/
public void zipDir(File srcFile, ZipOutputStream zos, String name) {
// 进入srcFile文件夹
File[] files = srcFile.listFiles();
FileInputStream fis = null;
for (File file : files) {
if (file.isFile()) {
ZipEntry entry = new ZipEntry(name + "\\" + file.getName());
try {
zos.putNextEntry(entry);
fis = new FileInputStream(file);
int len;
byte[] buf = new byte[8 * 1024];
while ((len = fis.read(buf)) != -1) {
zos.write(buf,0,len);
}
} catch (IOException e) {
throw new RuntimeException(e);
}
} else {
zipDir(file, zos, name + "\\" + file.getName());
}
}
}
六、工具包(commons-io)
Commons是apache开源基金组织提供的工具包,里面有很多帮助我们提高开发效率的API,比如:
# 字符串工具类
StringUtils
# 数字工具类
NumberUtils
# 数组工具类
ArrayUtils
# 随机数工具类
RandomUtils
# 日期工具类
DateUtils
# 秒表工具类
StopWatch
# 反射工具类
ClassUtils
# 系统工具类
SystemUtils
# 集合工具类
MapUtils
# bean工具类
Beanutils
# io的工具类
Commons-io
.....
七、工具包(hutool)
hutool是国人开发的开源工具包,里面有很多帮助我们提高开发效率的API
# 日期时间工具类
DateUtil
# 计时器工具类
TimeInterval
# 字符串工具类
StrUtil
# 16进制工具类
HexUtil
# Hash算法类
HashUtil
# 对象工具类
ObjectUtil
# 反射工具类
ReflectUtil
# 泛型类型工具类
TypeUtil
# 分页工具类
PageUtil
# 数字工具类
NumberUtil