JAVA字符编码系列二:Unicode,ISO-8859,GBK,UTF-8编码及相互转换.
1.Unicode可以之间转换成GBK,UTF-8,ISO-5589-1编码格式。但是Unicode —>ISO-8859-1是非可逆的。
2.GBK -> ISO-5589-1,则会产生乱码,因为汉字是2字节的,转换后每个字节在ISO-5589-1字符集中找不到对应的信息,就用“?替代”,所以每个汉字会显示两个“?”。如:“字符”则会显示为“????”。
3.但是当GBK ->ISO-5589-1 ->GBK,最终的GBK编码可以正常显示。正所谓负负得正。
学习Link: http://www.busfly.cn/csdn/post/450.html
1.Unicode可以之间转换成GBK,UTF-8,ISO-5589-1编码格式。但是Unicode —>ISO-8859-1是非可逆的。
2.GBK -> ISO-5589-1,则会产生乱码,因为汉字是2字节的,转换后每个字节在ISO-5589-1字符集中找不到对应的信息,就用“?替代”,所以每个汉字会显示两个“?”。如:“字符”则会显示为“????”。
3.但是当GBK ->ISO-5589-1 ->GBK,最终的GBK编码可以正常显示。正所谓负负得正。
学习Link: http://www.busfly.cn/csdn/post/450.html