1. 本周学习总结
1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容。
2. 书面作业
将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。
Q1. 字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)
1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)
1.2 生成文件大小多少?分析该文件大小
- 分析
属性 | 字节 |
---|---|
id | 7 |
name | 6 |
age | 2 |
grade | 4 |
分隔符*3 | 3 |
换行 | 2 |
每行24字节,共三行,24*3=72(字节)。
1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?
- 0字节;
- 使用close()方法可以自动调用flush()来清空缓冲区;调用PrintWriter的println方法,但在后面不close(),数据只写在缓冲区,而未写到文件,导致数据丢失。
参考:本题具体要求见流与文件实验任务书-题目1-2.1
参考代码:TextFileTest.java
Q2. 缓冲流
2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间
- 分析:
BufferedReader是字符流读取文本,通过使用缓冲区缓冲各个字符,从而实现数据的快速存取;Scanner使用System.in的read方法每次只能读取一个字节的数据。
2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因。
- 写入速度提升了;
- 调用BufferedWriter方法,使用了缓冲区,BufferedWriter可以缓冲数据,使数据高效写入。
参考:本题具体要求见流与文件实验任务书-题目1-2.2到2.3
参考代码:BufferedReaderTest.java
Q3. 字符编码
3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)
- FileReader,BufferedReader只能按系统默认的字符集(如GBK)来解码,但是EncodeTest.txt是按照UTF-8进行编码的,所以,UTF-8编码字符使用GBK编码来解析,会出现乱码。
- 解决方法如下:
3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。
package streamAndFile;
import java.io.BufferedReader;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.PrintWriter;
public class ConvertGBK2UTF8 {
static void convertGBK2UTF8(String src, String dst) throws IOException {
BufferedReader br = null;
try{
FileInputStream fis = new FileInputStream(src);
InputStreamReader isr = new InputStreamReader (fis,"UTF-8");
br = new BufferedReader(isr);
String line = null;
PrintWriter pw = null;
pw = new PrintWriter(dst);
while((line = br.readLine())!=null){
pw.print(line);
}
pw.close();
}finally{
if(br!= null){
br.close();
}
}
}
}
参考:InputStreamReaderTest.java与教学PPT
Q4. 字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream
4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)
4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?
- 如图,生成文件大小81字节;
- 分析:
属性 | 字节 |
---|---|
int | 8 |
UTF | 6 |
double | 8 |
分隔符*3 | 3 |
换行符 | 2 |
一行27个字节,共3行,27*3=81(字节)。变大了;
4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。
- 00 1E BF 69表示2015081;
00 09表示分隔符;
E8 BF 9E,E6 9F 90,E6 9F 90分别表示连,某,某;
00 00 00 14表示20;
14 40 4E 00 00 00 00 00表示60;
00 00
依次类推......
4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录
try {
ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream("student2.dat"));
out.writeObject(stu);
out.close();
ObjectInputStream in = new ObjectInputStream(new FileInputStream("student2.dat"));
Student[] students = (Student[]) in.readObject();
in.close();
for (Student student : students)
System.out.println(student);
} catch (Exception e) {
e.printStackTrace();
}
参考:本题具体要求见流与文件实验任务书-题目1-1
Q5. Scanner基本概念组装对象
编写public static List<Student> readStudents(String fileName)
从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由。
//201521123081
public static void main(String[] args) throws IOException {
readStudents("e:\\Students.txt");
}
public static List<Student> readStudents(String fileName){
ArrayList<Student>studentList=new ArrayList<Student>();
Scanner input = null;
try {
input = new Scanner(new File(fileName),"UTF-8");
} catch (FileNotFoundException e) {
e.printStackTrace();
}
while(input.hasNextLine()){
studentList.add(new Student(input.nextInt(),input.next(),input.nextInt(),input.nextDouble()));
input.close();
}
return studentList;
}
- 使用Scanner,逐行添加。
实验文件:Students.txt
参考:TextFileTest目录下TextFileTest.java
Q6. 选做:RandomAccessFile
6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号)
6.2 分析文件大小
Q7. 文件操作
编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
7.1 编写public static void findFile(String path,String filename)
函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)
7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)
7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。
参考代码:FindDirectories.java
参考:本题具体要求见流与文件实验任务书-题目2
7.4 选做:将指定目录及子目录下的所有.java
文件,转化成UTF-8
编码格式,并测试。
参考资料:判断文件的编码格式
Q8. 正则表达式
8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)
8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。
参考:本题具体要求见流与文件实验任务书-题目3
8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif"
,然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif
。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。
3. 码云及PTA
3.1. 码云代码提交记录
在码云的项目中,依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图
3.2 PTA以前未完成的题目
- 截图