怎么略过 Java/Scala 字符流中的无效的字符?

转自:

http://article.yeeyan.org/bilingual/316748


代码如下:

Source.fromFile(new File( path), "UTF-8").getLines()

运行这段代码时抛出一个MalformedInputException, 异常内容如下:

Exception in thread "main" java.nio.charset.MalformedInputException: Input length = 1
at java.nio.charset.CoderResult.throwException(CoderResult.java:260)
at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:319)



我不关心是否文件中所有行都被读取,怎么才能让代码在读取文件内容时略过无效字符?

你可以通过调用这个函数来控制字节流解析行为:

CharsetDecoder.onMalformedInput

由于函数调用时会自动创建 CharsetDecoder 对象,因此,在通常情况下, 函数调用时一般不需要传递 CharsetDecoder 对象。当需要定制该对象行为时,必须显示定义 CharsetDecoder 对象, 而不是只使用字符集名称。

参考Java API中的 InputStreamReader 的处理过程:

InputStream in = ...;
CharsetDecoder decoder = StandardCharset.UTF_8.newDecoder();
decoder.onMalformedInput(CodingErrorAction.IGNORE);
Reader reader = new InputStreamReader(in, decoder);

需要注意下, 这段代码需要引用 Java 7 中的 StandardCharset , 对于早期版本, 可以使用标准类中的 Charset.forName("UTF-8") 或 Guava 中的 theCharsetsclass 。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值