我熟悉InputStream的概念,缓冲区以及它们有用的原因(例如,当您需要处理可能比机器RAM大的数据时).
我想知道,InputStream如何实际携带所有数据?如果转移了太多数据,是否会导致OutOfMemoryError?
案例场景
如果我从客户端连接到服务器,请求100GB文件,服务器开始使用缓冲区迭代文件的字节,并使用outputStream.write(byte [])将字节写回客户端.无论出于何种原因,客户端现在还没有准备好读取InputStream.服务器会继续无限期地发送文件的字节吗?如果是这样,输出流/输入流不会大于其中一台机器的RAM吗?
解决方法:
InputStream和OutputStream实现通常不会占用大量内存.实际上,这些类型中的“流”一词意味着它不需要保存数据,因为它是以顺序方式访问的 – 就像流可以在湖泊和海洋之间传输水而不保持相同的方式很多水本身.
但“流”并不是描述这一点的最佳词汇.它更像是一个管道,因为当您将数据从服务器传输到客户端时,每个阶段都会从客户端传输反压力,从而控制数据发送的速率.这类似于您的水龙头如何控制通过管道一直到城市水库的流量:
>当客户端读取数据时,只有当内部(小)缓冲区为空时,它的InputStream才会从操作系统请求更多数据.每个请求只允许传输有限数量的数据;
>当从操作系统请求数据时,其自己的内部缓冲区清空,并通知服务器有关新数据的空间大小.服务器只能发送这么多(在TCP中称为“流控制”:https://en.wikipedia.org/wiki/Transmission_Control_Protocol#Resource_usage)
>在服务器端,当客户端有空间接收数据时,服务器端OS会从其自己的内部缓冲区发送数据.当它自己的内部缓冲区清空时,它允许写入过程用更多数据重新填充它.
>作为服务器端进程write()s到其OutputStream,OutputStream将尝试将数据写入操作系统.当OS缓冲区已满时,它将使服务器进程等待,直到服务器端缓冲区有空间接受新数据.
请注意,慢速客户端可能会使服务器进程花费很长时间.如果您正在编写服务器,并且您无法控制客户端,那么考虑这一点非常重要,并确保在进行长时间数据传输时不会占用大量服务器端资源.
标签:java
来源: https://codeday.me/bug/20190727/1548972.html