java I/O
一、字符与字节
1、字节流和字符流
字节流可以处理所有类型的数据,如mb3,图片,文字,视频等。在读取时,读到一个字节就返回一个字节。
字符流仅能够处理纯文本数据,如txt文本等。在读取时,读到一个或多个字节,先查找指定的编码表,然后将查到的字符返回。
2、字符,字节与编码
字节(Byte)
字节事通过网络传输信息或在内存中存储信息的单位,是计算机信息技术用于计量存储容量和传输容量的一种计量单位。
1个字节等于8位二进制,即一个8位的二进制数,是一个很具体的存储空间。
如:0x01,0x45..
字符(Char)
字符是人们使用的记号,抽象意义上的一个符号。
如:’1’,’中’,’a’,’$’…
3、字符集(Charset)
“字符集”也称为“编码”。
各个国家和地区所制定的不同ANSI编码标准中,都只规定了各自语言所需的“字符”。
比如:汉字便准(GB2312)中没有规定韩国语字符怎样存储。这些ANSI编码标准所规定的内容包含两层含义:
1.使用那些字符。也就是说哪些汉字,字母和符号会被收入标准中。所包含“字符”的集合就叫做“字符集”。
2.规定每个“字符”分别用一个字节还是多个字节来存储,用那些字节来存储,这格规定就叫做“编码”。
各个国家和地区在制定编码标准的时候,“字符的结合”和“编码”一般都是同时指定的。因此,我们平时所说的“字符集”,比如:GB2312,GBK,JIS等,除了有“字符的集合”这层含义外,同时也包含了“编码”的含义。
4、ANSI
字符串在内存中,如果“字符”是以ANSI编码形式存在的,一个字符可能使用一个字节或多个字节来表示,那么我们称这种字符串位ANSI字符串或多字节字符串。不同ANSI编码所规定的标准是不相同的,因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种编码规则,才能够知道它包含了哪些“字符”。
5、UNICODE
字符串在内存中,如果“字符”是以在UNICODE中的序号存在的,那么我们称这种字符串位UNICODE字符串或者宽字符串。对于UNICODE字符串来说,不管在什么环境下,他所代表的“字符”内容总是不变的。用来给UNICODE字符集编码的标准有很多种,比如:UTF-8,UTF-7,UTF-16,UnicodeLittle,UnicodeBig等。
二、使用字节流来读写数据
1、写入字节流
package IOUtil;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
public class TestStream {
public static void main(String[] args) {
// Fileinputstream可用方法
// read() --返回一个整型,即一个二进制数
// read(byte[] b) --传入字节数组,根据字节数组的大小,从文件中读取相应大小的内容放入字节数组中
// read(byte[] int off,int len) --传入定义了偏移量的字节数组,即定义了开始读取的位置以及读取长度
try {
FileInputStream fileInputStream=new FileInputStream("C:\\Users\\wjdri\\Documents\\GitHub\\html.txt");
byte input[]=new byte[5]; //这里字节大小不要超过文件大小
fileInputStream.read(input);
String inputString=new String(input,"gbk"); //java通常会以系统默认的字符集作为当前解码的方式,如果字符集不正确将会出现乱码
System.out.println(inputString);
fileInputStream.close()
// 有流的打开,读取最后应该有流的关闭
} catch (FileNotFoundException e) {
e.printStackTrace();
}catch (IOException e) {
e.printStackTrace();
}
}
}
2、写出字节流
package IOUtil;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
public class WriteByteStream {
public static void main(String[] args) {
try {
FileOutputStream fileOutputStream=new FileOutputStream("C:\\Users\\wjdri\\Documents\\GitHub\\htmlw.txt");
// fileOutputStream所包含的方法
// write(byte[] b) 直接写出一个字节数组
// write(int b) 直接写出一个字节
// write(byte[] b,int off,int len) 写出一个字节数组,并且定义字节数组的偏移和写出的长度
String outString="write 1234 写出数据";
//这里为文本数组,如果需要输出其他格式数组也需要使用相应的方法将文件转换为相应的字节型数组
byte output[]=outString.getBytes("UTF-8");
fileOutputStream.write(output);
// 当数组输出/输入流结束后一定记住关闭流
fileOutPutStream.close()
} catch (FileNotFoundException e) {
e.printStackTrace();
}catch (IOException e) {
e.printStackTrace();
}
}
}
3、输入流和输出流结合实现文件的拷贝
package IOUtil;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
public class CopyByByteStream {
public static void main(String[] args) {
try {
FileInputStream fileInputStream=new FileInputStream("C:\\Users\\wjdri\\Documents\\GitHub\\html.txt");
FileOutputStream fileOutputStream=new FileOutputStream("C:\\Users\\wjdri\\Documents\\GitHub\\new_html.txt");
// 由于50个字节的大小无法装下所需要读取的文件,所以需要通过循环来读取
byte input[] =new byte[50];
while(fileInputStream.read(input)!=-1){//这里返回一个int,为所读取到的字节的长度,如果已经没有读取到了则返回0
fileOutputStream.write(input);
}
fileInputStream.close();
fileOutputStream.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
}catch (IOException e) {
e.printStackTrace();
}
}
}