起因
老师布置了一道题,题目是使用随机文件流类RandomAccessFile将一个文本文件倒置读出。然后我百度了一下别人的写法,抄了一遍。我旁边的女同学按照一样的代码,抄了一遍。结果出现问题了。
DEBUG过程
我看了一遍觉得是一模一样的代码,找不出错误,之后就喊来大佬DEBUG,输出是一共75个字节,然后代码的问题是length–那里出了错,因为当length是1的时候,length第一遍length–了,length等于0。
File file = new File("c.txt");
try {
RandomAccessFile raf = new RandomAccessFile(file, "r");
long length = raf.length();
StringBuffer sb = new StringBuffer();
System.out.println(length);
while (length > 0) {
length--;
raf.seek(length);
int c = (char) raf.readByte();
// 如果asc码<=255,>=0,则判断是个英文字符,添加到字符串中.
if (c >= 0 && c <= 255) {
sb.append((char) c);
} else {
// 如果不在asc码范围内,则判断是个汉字字符
// 汉字字符是占2个字节的,所以length再退一个字节
length-=2;
raf.seek(length);
byte[] cc = new byte[3];
// cc被复制为文件中连续的两个字节
raf.readFully(cc);
sb.append(new String(cc));
}
}
System.out.println(sb);
raf.close();
} catch (Exception e) {
e.printStackTrace();
}
但是我觉得逻辑是没问题的,因为不会出现不满足length为1的时候不满足c >= 0 && c <= 255这个条件。
所以我们开始输出了长度,在妹子电脑上长度是73,然后上面那段文字中有16个不是中文的字符,所以减去16个字节,是57个字节,所以一个中文不是两个字节,而应该是三个字节。
结论
如果是采用UTF-8编码的情况下,一个中文是三个字节。如果采用GBK编码的情况下,是两个字节。