java的unicode_java与Unicode

在notepad++中用utf8格式保存“你好”两个汉字,文件名为a.txt.

在eclipse中设置编码格式为gbk.在eclipse中用FileReader读取这个文件。FileReader的read方法返回的为int型,用char做强制转换。结果出现乱码,第一个乱码为“浣”。

由于a.txt中的编码格式为utf8,故在硬盘中"你"保存为1110 0100,1011 1101,1010 0000.由于eclipse的格式为gbk,每个gbk字符占两个字节。故以gbk格式读取时,1110 0100,1011 1101(0xE4BD)被解读为gbk格式的“浣”。又因为java的字符串在内存中以unicode表示,故做了一次编码转换。这个"浣"读入内存后采用unicode表示,具体表示为0x6D63.

最后FileReader的read方法返回的int型数值是"浣"unicode编码也就是0x6D63的十进制形式。用char强转之后依然是“浣”。

用char进行强转时,总是会试图用unicode格式去解码。例如,不论eclipse的编码格式是什么,(char)28003永远输出的是"浣",因为“浣”的unicode编码为0x6D63,而28003转换为十六进制也是0x6D63。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值