关于java中的编码相关内容_java的编码工作是干什么的-CSDN博客

本文链接：https://blog.csdn.net/qq_40806970/article/details/105873010

所有的I/O基本上可以分为两大阵营：面向字符的输入/输出流；面向字节的输入/输出流。面向字符或者说面向字节中的所谓“面向”，是指这些类在处理输入/输出的时候，在哪个意义上保持一致。

如果面向字节，那么这类工作要保证系统中的文件二进制内容和读入JVM内部的二进制内容一致，不能变换任何0和1的顺序。这种输入/输出方式很适合读入视频文件或者音频文件，或者任何不需要做变换的文件内容。

而面向字符的I/O是指希望系统中的文件的字符和读入内存的“字符”（注意和字节的区别）要一致。例如，我们的中文版WindowsXP系统上有一个GBK的文本文件，其中有一个“永”字，这个字的GBK编码什么不用管，当我们使用面向字符的I/O把它读入内存并保存在一个char型变量中时，我希望I/O系统不要直接把“永”字的GBK编码放到这个字符（char）型变量中，我不关心这个char型变量具体的二进制内容到底是多少，我只希望这个字符读进来之后仍然是“永”字。

从这个意义上也可以看出，面向字符的I/O类，也就是Reader和Writer类，实际上隐式地做了编码转换，在输出时，将内存中的Unicode字符使用系统默认的编码方式进行了编码，而在输入时，将文件系统中已经编码过的字符使用默认编码方案进行了还原。这里要注意：Reader和Writer只会使用这个默认的编码来做转换，而不能为一个Reader 或者Writer指定转换时使用的编码。这也意味着，如果使用中文版Windows XP系统，其中存放了一个UTF-8编码的文件，当采用Reader类来读入的时候，它还会使用GBK来做转换，转换后的内容当然不对。这其实是一种傻瓜式的功能提供方式，对大多数初级用户（以及不需要跨平台的高级用户）来说反而是一件好事。

如果用到GBK编码以外的文件，就必须采用编码转换：一个字符与字节之间的转换。因此，Java的I/O系统中能够指定转换编码的地方，也就在字符与字节转换的地方，那就是InputStreamReader和OutputStreamWriter。这两个类是字节流和字符流之间的适配器类，它们承担编码转换的任务。