java io 汉字读取_Java_I/O读取里的那些中文花样

废话没有那么多啦.直接切中要害! 对于读取本地文件中文乱码以及改变UTF8格式后依然有部分乱码的操作过程,补救亦或者正确的姿势.先看常规的读取(至少我第一反应想起来就是这么写的...)

1 //如果失误,抛出IO异常在控制台

2 public static String read(String filename) throwsIOException{3 BufferedReader in=new BufferedReader(newFileReader(filename));4 String s;5 StringBuilder sb=newStringBuilder();6 //一行一行的读,直到碰见null则说明文件读到末尾了

7 while((s=in.readLine())!=null){8 //容易读中文乱码,所以设置UTF8

9 String str=new String(s.getBytes(),"UTF-8");10 //每次读完一个加上换行符

11 sb.append(str+"\n");12 }13 //关闭流

14 in.close();15 returnsb.toString();16 }

这样子看起来好高大上啊. 几行代码分分钟就读取文件了呢.[String 可以用list啊 不用换行而已.],但是问题来了...随便打个字,写个文件.咱们读取一下看看.

1 1.//这是 1 ge 文件读取测试

2 2.//目的是为了ceshi文件

3 3.这么正常的打印是为了更好的...4 4.什么?

这是测试打印内容,看输出

3e1edf37d5d67ac9d3c5cfd15003016e.png

哎呀呀...什么情况...啰嗦一下:

问题出在FileReader读取文件的过程中,FileReader继承了InputStreamReader,但并没有实现父类中带字符集参数的构造函数,所以FileReader只能按系统默认的字符集来解码,然后在读取转UTF-8的过程中编码出现损失,造成结果不能还原最初的字符。就是问号了.

知道了why...那么how呢?哈.就用InputStreamReader 好啦#|BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));|# 呐~ 这样就okay喽

1 //如果失误,抛出IO异常在控制台

2 public static List readList(String filename) throwsIOException{3 BufferedReader in=new BufferedReader(new InputStreamReader(new FileInputStream(filename),"UTF-8"));4 String s;5 List ll=new ArrayList();6 //一行一行的读,直到碰见null则说明文件读到末尾了

7 while((s=in.readLine())!=null){8 ll.add(s);9 }10 //关闭流

11 in.close();12 returnll;13 }

Okay~ 这么问题就解决了...其实还有一个更简单呐方法...你文件编码保存的时候就直接UTF-8...哇哈哈哈哈哈~但是不是总惦记这,万一忘了这样保险一点.

_叶落星辰

@鸣谢 iteye 的 gundumw100  阐述编码为啥子丢了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值