废话没有那么多啦.直接切中要害! 对于读取本地文件中文乱码以及改变UTF8格式后依然有部分乱码的操作过程,补救亦或者正确的姿势.先看常规的读取(至少我第一反应想起来就是这么写的...)
1 //如果失误,抛出IO异常在控制台
2 public static String read(String filename) throwsIOException{3 BufferedReader in=new BufferedReader(newFileReader(filename));4 String s;5 StringBuilder sb=newStringBuilder();6 //一行一行的读,直到碰见null则说明文件读到末尾了
7 while((s=in.readLine())!=null){8 //容易读中文乱码,所以设置UTF8
9 String str=new String(s.getBytes(),"UTF-8");10 //每次读完一个加上换行符
11 sb.append(str+"\n");12 }13 //关闭流
14 in.close();15 returnsb.toString();16 }
这样子看起来好高大上啊. 几行代码分分钟就读取文件了呢.[String 可以用list啊 不用换行而已.],但是问题来了...随便打个字,写个文件.咱们读取一下看看.
1 1.//这是 1 ge 文件读取测试
2 2.//目的是为了ceshi文件
3 3.这么正常的打印是为了更好的...4 4.什么?
这是测试打印内容,看输出
哎呀呀...什么情况...啰嗦一下:
问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在读取转UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。就是问号了.
知道了why...那么how呢?哈.就用InputStreamReader 好啦#|BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));|# 呐~ 这样就okay喽
1 //如果失误,抛出IO异常在控制台
2 public static List readList(String filename) throwsIOException{3 BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));4 String s;5 List ll=new ArrayList();6 //一行一行的读,直到碰见null则说明文件读到末尾了
7 while((s=in.readLine())!=null){8 ll.add(s);9 }10 //关闭流
11 in.close();12 returnll;13 }
Okay~ 这么问题就解决了...其实还有一个更简单呐方法...你文件编码保存的时候就直接UTF-8...哇哈哈哈哈哈~但是不是总惦记这,万一忘了这样保险一点.
_叶落星辰
@鸣谢 iteye 的 gundumw100 阐述编码为啥子丢了