我的问题和如上博客一样即:
问题:程序在eclipse中进行开发,涉及一些IO操作,且需要在不同的机子上跑,因此为了方便,将代码打包成了jar包。但是发现在eclipse中结果运行正确,在cmd中运行结果却错误。
我的需求:从多个记事本文件中读取数据,然后写入一个记事本中。
我的问题:写入记事本后中文乱码。
如何解决:以键值的形式在启动jvm时规定一些输入参数(cmd中执行时,只需在java后面加上-Dfile.encoding=utf-8即可)
造成的原因思考:
如上经验所说:
由于JDK是国际版的,在编译的时候,如果我们没有用-encoding参数指定我们的JAVA源程序的编码格式,则javac.exe首先获得我们操作系统默认采用的编码格式,也即在编译java程序时,若我们不指定源程序文件的编码格式,JDK首先获得操作系统的file.encoding参数(它保存的就是操作系统默认的编码格式,如WIN2k,它的值为GBK),然后JDK就把我们的java源程序从file.encoding编码格式转化为JAVA内部默认的UNICODE格式放入内存中。然后,javac把转换后的unicode格式的文件进行编译成.class类文件,此时.class文件是UNICODE编码的,它暂放在内存中,紧接着,JDK将此以UNICODE编码的编译后的class文件保存到我们的操作系统中形成我们见到的.class文件。对我们来说,我们最终获得的.class文件是内容以UNICODE编码格式保存的类文件,它内部包含我们源程序中的中文字符串,只不过此时它己经由file.encoding格式转化为UNICODE格式了。当我们不加设置就编译时,相当于使用了参数:javac -encoding gbk XX.java,当然就会出现不兼容的情况。
我的编译:我使用编码格式为UTF-8的eclipse工具打包生成jar文件
我的运行:使用操作系统自带的DOS环境(GBK编译)解释运行,并写入ANSI格式的记事本
我的生成:带有ANSI中文乱码的文件,使用工具强行转换为utf-8,也会有乱码的中文和格式