java字节流与字符流的区别&编码&缓冲

最新推荐文章于 2023-07-18 23:12:03 发布

android_mylove

最新推荐文章于 2023-07-18 23:12:03 发布

阅读量193

点赞数

文章标签：移动开发操作系统运维

部分摘自http://blog.csdn.net/cynhafa/article/details/6882061

所有的文件在存储和传输时都是以字节（byte）为单位进行的，包括图片等都是按字节的方式存储的，而字符只有在内存中才会形成，在磁盘上保留的并不是文件的字符而是先把字符编码成字节，再储存这些字节到磁盘。在读取文件（特别是文本文件）时，也是一个字节一个字节地读取以形成字节序列。所以在开发中，字节流使用较为广泛
字节流主要用来处理字节或二进制对象
字符流主要用来处理字符或字符串
字节流可用于任何类型的对象，包括二进制对象，而字符流只能处理字符或者字符串
字节流提供了处理任何类型的IO操作的功能，但它不能直接处理Unicode字符，而字符流就可以
字符流处理的单元为2个字节的Unicode字符，分别操作字符、字符数组或字符串，而字节流处理单元为1个字节，操作字节和字节数组。所以字符流是由Java虚拟机将字节转化为2个字节的Unicode字符为单位的字符而成的，所以它对多国语言支持性比较好！如果是音频文件、图片、歌曲，就用字节流好点，如果是关系到中文（文本）的，用字符流好点
字节流在操作时本身不会用到缓冲区（内存），是文件本身直接操作的，而字符流在操作时使用了缓冲区，通过缓冲区再操作文件。
在字符流的操作中，所有的字符都是在内存中形成的，在输出前会将所有的内容暂时保存在内存之中，所以使用了缓冲区暂存数据。
字节流是最基本的，所有的InputStream和OutputStream的子类都是,主要用在处理二进制数据，它是按字节来处理的；但实际中很多的数据是文本，又提出了字符流的概念，它是按虚拟机的encode来处理，也就是要进行字符集的转化，这两个之间通过 InputStreamReader,OutputStreamWriter来关联，实际上是通过byte[]和String来关联，在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的
在从字节流转化为字符流时，实际上就是byte[]转化为String时，public String(byte bytes[], String charsetName)
有一个关键的参数字符集编码，通常我们都省略了，那系统就用操作系统的lang，而在字符流转化为字节流时，实际上是String转化为byte[]时，byte[]String.getBytes(String charsetName)也是一样的道理

对于我们常用的GBK中，英文是占用1个字节，中文是2个
对于UTF-8，英文是1个，中文是3个
对于Unicode，英文中文都是2个