【JAVA】文本处理(1)—删除文本中的空白行

一、前言

本次学习应用于文本处理方面,主要的功能是为了实现删除文本中的空白行,便于我们阅读和储存。

java.io包为我们提供了相关的API,实现了对所有外部系统的输入输出操作,这就是我们这章所要学习的技术。

Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流。

二、分析学习

1)数据源

数据源data source,提供数据的原始媒介。常见的数据源有:数据库、文件、其他程序、内存、网络连接、IO设备。如图所示。

​ 数据源分为:源设备、目标设备。

  1. 源设备:为程序提供数据,一般对应输入流。
  2. 目标设备:程序数据的目的地,一般对应输出流。
    1

2)数据流

是一个抽象、动态的概念,是一连串连续动态的数据集合。

​ 对于输入流而言,数据源就像水箱,流(stream)就像水管中流动着的水流,程序就是我们最终的用户。我们通过流(A Stream)将数据源(Source)中的数据(information)输送到程序(Program)中。

​ 对于输出流而言,目标数据源就是目的地(dest),我们通过流(A Stream)将程序(Program)中的数据(information)输送到目的数据源(dest)中。
2

3)流的概念细分

按流的方向分类:

​ 1. 输入流:数据流向是数据源到程序(以InputStream、Reader结尾的流)。

​ 2. 输出流:数据流向是程序到目的地(以OutPutStream、Writer结尾的流)。

按处理的数据单元分类:

​ 1. 字节流:以字节为单位获取数据,命名上以Stream结尾的流一般是字节流,如FileInputStream、FileOutputStream。

​ 2. 字符流:以字符为单位获取数据,命名上以Reader/Writer结尾的流一般是字符流,如FileReader、FileWriter。

按处理对象不同分类:

​ 1. 节点流:可以直接从数据源或目的地读写数据,如FileInputStream、FileReader、DataInputStream等。

​ 2. 处理流:不直接连接到数据源或目的地,是”处理流的流”。通过对其他流的处理提高程序的性能,如BufferedInputStream、BufferedReader等。处理流也叫包装流。

​ 节点流处于IO操作的第一线,所有操作必须通过它们进行;处理流可以对节点流进行包装,提高性能或提高程序的灵活性。

三、编程学习

1)任务要求

  • 完成一个 java application应用程序,实现文本文档的读取和写入,将修改后(删除空白行)的新内容存入到新的文本文档中。
  • 应用数据流的相关知识,使用BufferedReader/BufferedWriter处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。使用InputStreamReader/OutputStreamWriter处理流:将字节流对象转化成字符流对象。

2)程序代码

/* 项目名称:Task_Shao
 * 创建时间:2019年1月23日
 * 创建者:Administrator
 * 创建地点:hb
 * 功能:删除空白行(java IO流)
 */
import java.io.*;//导入java.io包中的所有类
import java.util.Scanner;//导入java.util包中的Scanner类
public class delete_blank_lines {//创建类名
	public static void main(String[] args) throws Exception{//程序主函数入口
		Scanner s = new Scanner(System.in);//获取键盘输入并赋值给s字符串
	    Scanner t = new Scanner(System.in);//获取键盘输入并赋值给t字符串
	    System.out.println("请输入想要打开的文本文档:");//输出提示信息
	    String a = s.nextLine();//定义字符串变量,与用户输入的信息相等
	    System.out.println("请输入想要写入内容的文本文档:");//输出提示信息
	    String b = t.nextLine();//定义字符串变量,与用户输入的信息相等
		File file=new File(b);//创建待写入文件		
		if(!file.exists()) {//若指定路径下该文件不存在执行if语句
			file.createNewFile();//在指定路径下新建该文件
			}
		//如果存在该文件夹则继续往下执行		
		try{ //将逻辑语句用try包起来
        int i=0;//新建行号的符号i
		String string=null;//新建空字符串
		//FileInputStream fis = null;
        //BufferedInputStream bis = null;
        //FileOutputStream fos = null;
        //BufferedOutputStream bos = null;
		//读出文档数据流方式
		InputStreamReader isr=new InputStreamReader(new FileInputStream(a),"UTF-8");//选择编码方式,避免乱码
		BufferedReader read=new BufferedReader(isr);//写入数据流方式
		OutputStreamWriter osw=new OutputStreamWriter(new FileOutputStream(file),"UTF-8");//选择编码方式,避免乱码
		BufferedWriter write=new BufferedWriter(osw);//写入数据流方式
		while((string = read.readLine())!= null) {//readLine()方法,要读取的一行内容不为空就一直执行
			if(string.equals("")) {//if条件语句
			continue;//该行为空时不进行任何操作
			}
			else {//否则
			i++;
			//	write.write("["+i+"]");//可在文档中标出行号(有需要时可以取消该注释)
			write.write(string+"\r\n");//在新文档中写入指定内容			
			}
		}	
		write.close();//关闭流
		read.close();//关闭流
		System.out.println("所需内容已写入指定文档!");//输出提示信息	
        }
		catch(Exception e) {//当代码异常时用catch捕获异常
			e.printStackTrace();//printStackTrace()方法是打印异常信息在程序中出错的位置及原因
		}		
	}
}

3)执行结果(以西游记文本为例)

2
1
3

四、总结(Java中IO流类的体系

Java为我们提供了多种多样的IO流,我们可以根据不同的功能及性能要求挑选合适的IO流,如图所示,为Java中IO流类的体系。

​ 注:这里只列出常用的类,详情可以参考JDK API文档。粗体标注为常用!

113

从上图发现,很多流都是成对出现的,比如:FileInputStream/FileOutputStream,显然是对文件做输入和输出操作的。我们下面简单做个总结:

1. InputStream/OutputStream

​ 字节流的抽象类。

2. Reader/Writer

​ 字符流的抽象类。

3. FileInputStream/FileOutputStream

​ 节点流:以字节为单位直接操作“文件”。

4. ByteArrayInputStream/ByteArrayOutputStream

​ 节点流:以字节为单位直接操作“字节数组对象”。

5. ObjectInputStream/ObjectOutputStream

​ 处理流:以字节为单位直接操作“对象”。

6. DataInputStream/DataOutputStream

​ 处理流:以字节为单位直接操作“基本数据类型与字符串类型”。

7. FileReader/FileWriter

​ 节点流:以字符为单位直接操作“文本文件”(注意:只能读写文本文件)。

8. BufferedReader/BufferedWriter

​ 处理流:将Reader/Writer对象进行包装,增加缓存功能,提高读写效率。

9. BufferedInputStream/BufferedOutputStream

​ 处理流:将InputStream/OutputStream对象进行包装,增加缓存功能,提高 读写效率。

10. InputStreamReader/OutputStreamWriter

​ 处理流:将字节流对象转化成字符流对象。

11. PrintStream

​ 处理流:将OutputStream进行包装,可以方便地输出字符,更加灵活。

建议

​ 上面的解释,一句话就点中了流的核心作用。大家在后面学习的时候,用心体会。
希望大家在编程和学习的时候,多查看书籍和API集,实践才能出真知。大家都一起加油努力!~

参考链接:
https://blog.csdn.net/mas2005/article/details/82432068
https://bbs.csdn.net/topics/380239879
https://blog.csdn.net/bks429/article/details/51814520


  • 4
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值