关于java中的编码相关内容

所有的I/O基本上可以分为两大阵营:面向字符的输入/输出流;面向字节的输入/输出流。面向字符或者说面向字节中的所谓“面向”,是指这些类在处理输入/输出的时候,在哪个意义上保持一致。

如果面向字节,那么这类工作要保证系统中的文件二进制内容和读入JVM内部的二进制内容一致,不能变换任何0和1的顺序。这种输入/输出方式很适合读入视频文件或者音频文件,或者任何不需要做变换的文件内容。

而面向字符的I/O是指希望系统中的文件的字符和读入内存的“字符”(注意和字节的区别)要一致。例如,我们的中文版WindowsXP系统上有一个GBK的文本文件,其中有一个“永”字,这个字的GBK编码什么不用管,当我们使用面向字符的I/O把它读入内存并保存在一个char型变量中时,我希望I/O系统不要直接把“永”字的GBK编码放到这个字符(char)型变量中,我不关心这个char型变量具体的二进制内容到底是多少,我只希望这个字符读进来之后仍然是“永”字。

从这个意义上也可以看出,面向字符的I/O类,也就是Reader和Writer类,实际上隐式地做了编码转换,在输出时,将内存中的Unicode字符使用系统默认的编码方式进行了编码,而在输入时,将文件系统中已经编码过的字符使用默认编码方案进行了还原。这里要注意:Reader和Writer只会使用这个默认的编码来做转换,而不能为一个Reader 或者Writer指定转换时使用的编码。这也意味着,如果使用中文版Windows XP系统,其中存放了一个UTF-8编码的文件,当采用Reader类来读入的时候,它还会使用GBK来做转换,转换后的内容当然不对。这其实是一种傻瓜式的功能提供方式,对大多数初级用户(以及不需要跨平台的高级用户)来说反而是一件好事。

如果用到GBK编码以外的文件,就必须采用编码转换:一个字符与字节之间的转换。因此,Java的I/O系统中能够指定转换编码的地方,也就在字符与字节转换的地方,那就是InputStreamReader和OutputStreamWriter。这两个类是字节流和字符流之间的适配器类,它们承担编码转换的任务。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值