一、IO流的概念及划分
1. 概念
IO看字面意思,好像很抽象的样子。其实是Input(输入)/Output(输出)的首字母缩写。
流表示数据有有序集合,能从一个端传输到另一个端的过程。流的本质是:数据传输
2. 流的划分
-
按方向划分
输入流:将数据从介质(磁盘、网络)到当前程序的过程,以InputStream和Reader作为基类
输出流:将数据从程序写入到存储介质中,以OutputStream和Writer作为基类
-
按操作单元划分
字节流:二进制表示的数据,一个字节=8bit位,以InputStream和OutputStream作为基类
字符流:将数据以字符形式表示 ‘abcd’ ‘234’,以Reader和Writer作为基类
-
按照角色划分
节点流(介质流):数据从/向一个介质(磁盘、鼠标、屏幕)读/写的流,直接与介质相连,低级流。
处理流(过滤流):直接和节点流相连,借助低级流的创建,高级流
3. 字节和字符的区别
字节: 存储的数据是0101形式,只有机器能识别
字符: 底层也是0101形式存储的,但是表面上是用字符表示
区别:
-
读写的单元不同
字节流以字节(8bit)为单位,
字符流是以字符为单位。根据码表映射字符,一次可以读取多个文件 -
处理对象不同
字节流能处理所有类型的数据(图片、avi)
字符流只能处理字符类型的数据 -
处理效率
字节流处理效率高,直接进行读取
字符流效率较低,涉及到编码解码过程 -
可移植性
字节流可移植性高,和平台无关
字符流需要考虑编码解码过程
4. 节点流和处理流的区别:
- 节点流直接和介质相连
- 处理流直接和节点流相连
5. 各种码表:
计算机底层的数据都是用2进制存储
字符“a”对应在码表中有相应的数字表示
eg:(ASCII码表)
码表:将字符和数字建立起映射关系、字节和字符的相互转换
字符–>字节:编码过程, “Hello”.getBytes() 返回byte[]类型的数组
字节–>字符:解码过程, byte[] bys = {96,97,98} ->new String('a b c ')
-
ASCII码:一个字符中的7位表示(只用到一个字节8bit中的7位),对应的字节都是正数
-
ISO-8899-1:拉丁码表–>用一个字节中8位表示,可以表示正数0和负数1。
-
GBK国标:中文码表;用2个字节表示(2^16),2个字节中第一个字节开头(高)位为1,第二个字节开头位为0
-
Unicode:国际标准码表,无论什么文字都是2个字节
-
UTF-8:基于Unicode,一个字节表示存储信息,每一个字节头加入了编码信息
编码解码的常用方法:
public class Demo316 {
public static void main(String[] args) {
//当前默认的编码 编码类:Charset
Charset charset = Charset.defaultCharset();
System.out.println("当前系统默认编码为:"+charset);
//当前系统支持的所有字符集编码,用迭代器遍历
SortedMap<String,Charset> sortedMap = Charset.availableCharsets();
Iterator<Map.Entry<String,Charset>> iterator = sortedMap.entrySet().iterator();
System.out.println("当前系统支持的所有字符集编码:");
while (iterator.hasNext()){
Map.Entry<String,Charset> next = iterator.next();
System.out.println(next.getKey()+"--"+next.getValue());
}
//是否支持指定的编码格式(UTF-8)
boolean supported = Charset.isSupported("UTF-8");
System.out.println("是否支持UTF-8? "+supported);
//利用Charset进行指定格式的转码解码过程
String utf = "UTF-8";
Charset UTF = Charset.forName(utf);
//解码
CharBuffer charBuffer = UTF.decode(ByteBuffer.wrap("Hello".getBytes()));
System.out.println(charBuffer);
//编码
ByteBuffer byteBuffer = UTF.encode(charBuffer);
System.out.println(byteBuffer);
}
}
流使用规律:
1.明确读操作还是写操作(数据源是当前程序还是数据目的地是当前程序)
读:InputStream/Reader
写:OutputStream/Writer
2.明确是操作字节还是操作字符(明确操作基类)
读:InputStream(字节)/Reader(字符)
写:OutputStream(字节)/Writer(字符)
3.操作的具体介质(明确操作的具体类)
读:File(文件)/char、array、double(内存)/网络(Socket)/键盘(System.in)
写:File(文件)/char、array(内存)/网络(Socket)/屏幕(System.out)
4. 明确是否需要额外操作
缓冲区:BufferXXX
转换:InputStreamReader/OutputStreamWriter