问题描述
在进行文件流读取转换为字符串时,遇到了偶发的中文乱码问题,发现is的read方法不能很好的适应中文读取,
于是看了下read的源码,弄清楚了read的读取机制
解答
read的四个方法最终都会调用此方法,关键点在红圈处,根据定义的len长度和off偏移量,进行一个个
字节的读取,最后放到b数组中,为什么该方法头中说有可能会读不到len长度,就是因为当文件快读完
时,下一次读取达不到len长度,故读取的数量小于Len长度
使用read读取纯中文/英文数据时完全可以的,但当读取中英文混的数据,就会产生问题(存在刚好读取到截断某个中文字符),除非一次性把数据全部放到缓冲数组里,但是那样会产生效率问题。
建议解决办法
使用scanner类进行流数据的读取与转换
Scanner s = new Scanner(inputStream).useDelimiter(“\A”);
System.out.println(s.hasNext() ? s.next() : “”);
20220803于西安