jvm的设计者在设计之初时,是不允许使用各种编码方式的字符并存的。
这是因为各种不同的编码模式存在,开发者甚至打印字符和拼接字符都会显得十分困难。
所以java中,字符只会以Unicode来表示。
char c='的';
System.out.format("%x",(short)c)
打印结果为十六进制的0x7684
如果
char c=0x7684;
System.out.println(c)
打印是 ‘的’
JVM的这种约定使得一个字符分为两部分:jvm内部和os文件系统。
在jvm内部采取统一的Unicode表示,当字符从jvm内部转移到外部,就进行了编码转换。
那么I/O可以分为两类,面向字符的输入/出流和面向字节的输入/出流。
面向字符输入输出流(reader/writer类)不关心字符将以何种方式保存在jvm中,他只希望读出来的时候仍然是原有字符,但也不一定会是,因为reader或writer并不会指定转换时使用的编码,所以也有可能会出现乱码情况。
所以我们常使用inputStreamReader和outputStreamWriter来充当适配器的角色,这个角色介于字节流和字符流之间,他们来承担编码转换的任务。
面向字节流主要适用于视频文件或者音频文件,或者01不交换顺序的文件。