今天在写一个小demo,用到了中英混合的文本文件内容读取这个功能。
我就按照一般java读文件的方式写代码,但是,读出来才发现,都是乱码!!! 我就想,是不是读取的方式不对?
然后那我又想,应该是编码转换的问题。我就到网上搜,果然,也碰到了遇到和我一样问题的码农们。
最后找到一个blog,解决了我的问题。http://blog.csdn.net/zjy_hll/article/details/40401505
之前写xml文件读取的时候也遇到了这样的问题,但是忘了是怎么解决的了,现在想想当时应该记录一下的。
所以这次吸取教训,mark一下,时刻提醒自己。
这里再粘贴一下解决办法,都是上门那个blog的内容:
今天在写一个小程序,用到了通过URL获取本地tomcat服务器资源中文本文件(含中文)内容这个功能。刚开始,我就按照一般java读文件的方式写代码,但是,读出来才发现,都是乱码!!!
我就想,是不是读取的方式不对?那换其他的方式试试。然后我就试啊试啊!试了N多方法来读,没想到都是乱码。。。
那我又想,应该是编码转换的问题。我就到网上搜,果然,也碰到了遇到和我一样问题的同胞。
看大部分人的解决方式是:
EncodingUtils.getString(sb.toByteArray(),"GB2312")这种方式。
但是,对我的代码好像没用!!!
EncodingUtils.getString(sb.toByteArray("UTF-8"),"UTF-8")也不行,
EncodingUtils.getString(sb.toByteArray("UTF-8"),"GB2312")还是不行。。。
我不知道为什么好多好多帖子都说这样可行,反正我试了,不行。。。
我那个无奈啊!我那个烦躁啊。。。
后来我又在网上搜,搜着搜着,看到了一个讲txt文件编码方式的帖子。。。我突然有所感悟,会不会是txt文件的编码方式android识别不了,而我们转换的时候又没转对呢?
于是我打开一个txt文档,随便写了点儿中文,没有直接保存,而是"文件" -- > "另存为",然后出现了一个对话框,下面有三行:
第一行:文件名
第二行:保存类型
第三行:编码
然后我看到了.........................默认的编码是ANSI............................神呐!
我选择了UTF-8,保存了,导入模拟器,打开程序读文件,哦了,正常了。。。。。。。。。。。
另外,既然txt文件默认编码方式是ANSI,那么读取的时候是不是可以用ANSI来转换成GB2312或者UTF-8呢?个人认为应该可以,但我没试,有兴趣的可以试试