本文所基于的环境: openjdk version "11.0.4" 2019-07-16
(Oracle jdk也一样, 11之前的可能不一样, 11之前的我都没去看了)
我们都知道, InputStream有个read()方法, 每次可以读取一个字节, 返回的值是int类型, 返回值的范围在0~255之间, 当返回-1时, 表示已经没有读的了. 我们还知道, InputStream还有个read(byte[] b)方法, 可以将读取到的数据填充到byte[]数组中, 并返回读取到的字节数.
如果你不知道上面这些,建议还是先多看看输入流有关的操作再来阅读本文吧. 如果你知道这些, 那么问题来了:
- read()方法每次读取的是一个字节, 为什么返回的是int类型的?
- read()方法每次读取一个字节, Java中字节的范围是-128-127, 返回值的范围为什么是0-255? 不应该是-128-127吗? 诶, 如果返回值的范围是-128-127, 那-1怎么作为中止条件呢?
- read()方法读取到的数据的范围是0-255, read(byte[] b)读取到的是字节, 字节的范围是-128..... 恩? 这两个函数返回值的范围居然不一样???
我用一段代码来演示上面的情况, 直接将一个byte[]写入到文件中, 注意看, byte[]中有一个元素为-1(先想想, 用两种方法分别读取这个字节, 得到的结果是多少). 然后用上面两个方法分别读取这个文件, 然后将读取到的数据打印出来. 你能想到结果是多少吗?
public
下面是结果
1 255 254 127 0 128 // read()方法
1 -1 -2 127 0 -128 // read(byte[] b)方法
1 -1 -2 127 0 -128 // 原始数据
怎么样? 惊不惊喜? 意不意外?
现在来分析下结果, read(byte[] b)方法应该和大家的预期是一样的, 文件中的字节是什么值, 这个方法读取到的就是什么值.
一个文件, 本质就是01串, 不管你怎么去读, 这个文件都不会改变, 这个文件的每一个字节, 都是从0000 0000到1111 1111, 表示的范围都是-128-127(因为是以补码形式存储的). 我们试想一下, 如果read()方法直接把读取到的原始字节值返回给我们的话, 返回一个-1, 那这个-1指的是读完了还是指的是文件中某个字节是-1呢?
所以说, 这个"-1"必须好好处理下. 我们再来看一组数据:
- 1000 0001(-1的原码) -> 1111 1110(-1的反码) -> 1111 1111(-1的补码)
- 1000 0010(-2的原码) -> 1111 1101(-2的反码) -> 1111 1110(-2的补码)
- 1000 0000(-128的补码)(此处不明白的同学应该再去看看计算机组成原理, 可参考 传送门)
public
输出结果为
255
254
128
所以现在明白了jdk怎么处理"-1"了吗? 没错, 高位补零然后转化成十进制