开始摸索Java了,虽然还没开始涉及Java专业问题,但已经让我遇到头疼的编码问题了...
这次遇到的问题如下:
我在Eclipse中新建了properties文件,这里面的内容都是key=value形式,根据key读取value内容或者按照key写入value内容到properties文件中。
本来都很顺利,直到我配置了value内容为中文时出现了问题,读出来的编码是乱码,OMG。
我本能的反应是加了如下处理:
String str = new String(src, "UTF-8");
然而只是变成了另一种乱码。
这时,我先怀疑文件本身的编码,右击"properties"属性,发现Text file encoding是: Default(determined from content type: ISO-8859-1)
额,通过: Window -> Proferences -> Content Types -> Java Properties File,设置properties文件默认编码为UTF-8。更新后,确实为UTF-8格式的文件编码。
可是,测试后,仍为乱码,于是CSDN上求解。看到这篇: http://blog.csdn.net/jubincn/article/details/8060796
根据第2个方式,对编码进行转换:
String str = new String(src.getBytes("ISO-8859-1"),"UTF-8");
哈哈,能获得中文了!
看来,在处理乱码问题上,最简单的做法就是制定规则,项目中所有文件的存储都采用统一格式(推荐的是UTF-8)。
如果还出现乱码,那就是在处理的某个环节,忽略了编码格式。比如读/写文件时,没有指定编码为UTF-8,于是采用了该读/写方法的默认编码,像我遇到的就是“ISO-8859-1”,这时可以采取的措施是:在读/写方法处指定编码格式,或者确定该方法采用的编码格式,然后转换为UTF-8。