我正在尝试编写将处理POST请求并传输输入和输出的servlet.我的意思是它应该读取一行输入,在这一行上做一些工作,并写一行输出.它应该能够处理任意长的请求(因此也会产生任意长响应),而不会出现内存不足的异常.这是我的第一次尝试:
protected void doPost(HttpServletRequest request, HttpServletResponse response) {
ServletInputStream input = request.getInputStream();
ServletOutputStream output = response.getOutputStream();
LineIterator lineIt = lineIterator(input, "UTF-8");
while (lineIt.hasNext()) {
String line = lineIt.next();
output.println(line.length());
}
output.flush();
}
现在我使用curl测试了这个servlet并且它可以工作,但是当我使用Apache HttpClient编写客户端时,客户端线程和服务器线程都会挂起.客户端看起来像这样:
HttpClient client = HttpClientBuilder.create().build();
HttpPost post = new HttpPost(...);
// request
post.setEntity(new FileEntity(new File("some-huge-file.txt")));
HttpResponse response = client.execute(post);
// response
copyInputStreamToFile(response.getEntity().getContent(), new File("results.txt"));
问题很明显.客户端在一个线程中按顺序执行它的工作 – 首先它完全发送请求,然后才开始读取响应.但是,如果客户端没有读取输出(并且顺序客户端不是),则每行输入的服务器写入一行输出,然后服务器被阻止尝试写入输出流.这反过来会阻止客户端尝试将输入发送到服务器.
我认为curl有效,因为它以某种方式发送输入并同时接收输出(在单独的线程中?).所以第一个问题是Apache HttpClient可以配置为与curl类似吗?
接下来的问题是,如何改进servlet,这样不良的客户端不会导致服务器线程挂起?我的第一次尝试是引入中间缓冲区,它将收集输出直到客户端完成发送输入,然后servlet才会开始发送输出:
ServletInputStream input = request.getInputStream();
ServletOutputStream output = response.getOutputStream();
// prepare intermediate store
int threshold = 100 * 1024; // 100 kB before switching to file store
File file = File.createTempFile("intermediate", "");
DeferredFileOutputStream intermediate = new DeferredFileOutputStream(threshold, file);
// process request to intermediate store
PrintStream intermediateFront = new PrintStream(new BufferedOutputStream(intermediate));
LineIterator lineIt = lineIterator(input, "UTF-8");
while (lineIt.hasNext()) {
String line = lineIt.next();
intermediateFront.println(line.length());
}
intermediateFront.close();
// request fully processed, so now it's time to send response
intermediate.writeTo(output);
file.delete();
这样可行,不良行为的客户端可以安全地使用我的servlet,但另一方面,对于像curl这样的并发客户端,这个解决方案会增加不必要的延迟.并行客户端正在单独的线程中读取响应,因此当请求被消耗时,响应将逐行生成时,它将受益.
所以我想我需要一个字节缓冲区/队列:
>可以由一个线程写入,并由另一个线程读取
>最初只会在记忆中
>如果需要,将溢出到磁盘(类似于DeferredFileOutputStream).
在servlet中,我将生成新线程来读取输入,处理它,并将输出写入缓冲区,主servlet线程将从此缓冲区读取并将其发送到客户端.
你知道任何图书馆都喜欢那样做吗?或许我的假设是错误的,我应该做一些完全不同的事情……
最佳答案 要实现同时写入和读取,您可以使用Jetty HttpClient
我已使用此代码为您的仓库创建了拉取请求.
HttpClient httpClient = new HttpClient();
httpClient.start();
Request request = httpClient.newRequest("http://localhost:8080/line-lengths");
final OutputStreamContentProvider contentProvider = new OutputStreamContentProvider();
InputStreamResponseListener responseListener = new InputStreamResponseListener();
request.content(contentProvider).method(HttpMethod.POST).send(responseListener); //async request
httpClient.getExecutor().execute(new Runnable() {
public void run() {
try (OutputStream outputStream = contentProvider.getOutputStream()) {
writeRequestBodyTo(outputStream); //writing to stream in another thread
} catch (IOException e) {
e.printStackTrace();
}
}
});
readResponseBodyFrom(responseListener.getInputStream()); //reading response
httpClient.stop();