来源:http://blog.csdn.net/u013476542/article/details/52958858
在java中,一切存储在硬盘上的数据都是二进制的字节,当我们从硬盘读取到字节数组后,如果我们需要把字节 数组转化成String类型的字符串,
字节数组需要遵守一定的规则才能正确的转化为字符串,这就用到了编码 :charset。
byte[] b ;
1 String str =new String(b);
2String str =new String(b ,encoding);
第一种字节数组转字符串的方法虽然没有指明编码方式,内部使用了默认编码方式。
另一种情况:读取字节流的时候,一般需要转化成 字符串,也涉及到编码问题。
一般文件是用啥 编码 存的,取的时候就用 此编码读取。 在写读的时候,一般建议指定编码。BufferedReader br = new BufferedReader(new InputStreamReader(is));最好写成BufferedReader br = new BufferedReader(new InputStreamReader(is,encoding));encoding一般需要猜测文件的编码。嘿嘿。。。。
问题来了,Charset.defaultCharset()由什么决定的呢?1、如果使用了eclipse,由java文件的编码决定2、如果没有使用eclipse,则有本地电脑语言环境决定,中国的都是默认GBK编码
上面是我写的一个测试例子,1、通过eclipse 右键 run as =》java application 测试 为UTF-82、通过cmd命令行运行,结果为GBK
通过右键 该java文件 =》properties 在resourse里可以看到我的文件编码为UTF-8
windows环境,直接修改jdk编码在系统变量→新建 “JAVA_TOOL_OPTIONS” 变量,值为“-Dfile.encoding=UTF-8”