HTTPClient4.5.2学习笔记(七):高级话题(Advanced topics)

7.1. 自定义客户端连接

在某些情况下,可能需要自定义超过可以使用HTTP参数的HTTP消息来设置线路传输方式,以便能够处理非标准,不符合规定的行为。例如,对于网络爬虫,可能需要强制HttpClient接受格式错误的响应头,以便挽救消息的内容。

通常,插入自定义消息解析器或自定义连接实现的过程涉及几个步骤:

  • 提供一个自定义LineParser / LineFormatter接口实现。根据需要实现消息解析/格式化逻辑。

    lass MyLineParser extends BasicLineParser {
    
        @Override
        public Header parseHeader(
                CharArrayBuffer buffer) throws ParseException {
            try {
                return super.parseHeader(buffer);
            } catch (ParseException ex) {
                // Suppress ParseException exception
                return new BasicHeader(buffer.toString(), null);
            }
        }
    
    }

  • 提供一个自定义的HttpConnectionFactory实现。根据需要将默认请求写入器和/或响应解析器替换为自定义请求。

    HttpConnectionFactory<HttpRoute, ManagedHttpClientConnection> connFactory =
            new ManagedHttpClientConnectionFactory(
                new DefaultHttpRequestWriterFactory(),
                new DefaultHttpResponseParserFactory(
                        new MyLineParser(), new DefaultHttpResponseFactory()));

  • 配置HttpClient以使用自定义连接工厂。

    PoolingHttpClientConnectionManager cm = new PoolingHttpClientConnectionManager(
        connFactory);
    CloseableHttpClient httpclient = HttpClients.custom()
            .setConnectionManager(cm)
            .build();

    7.2. 有状态HTTP 连接

    虽然HTTP规范假定会话状态信息始终以HTTP Cookie的形式嵌入到HTTP消息中,因此HTTP连接始终是无状态的,但这种假设并不总是在现实生活中成立。 有些情况下,使用特定用户身份或特定安全上下文创建HTTP连接,因此无法与其他用户共享,并且只能由同一用户重复使用。 这种有状态HTTP连接的示例是具有客户端证书认证的NTLM认证连接和SSL连接。

    7.2.1. User token handler

    HttpClient依赖于UserTokenHandler接口来确定给定的执行上下文是否是用户特定的。 如果上下文是用户特定的,则此处理程序返回的令牌对象将被预期唯一标识当前用户,如果上下文不包含特定于当前用户的任何资源或详细信息,则为空。 用户令牌将用于确保用户特定的资源不会被其他用户共享或重用。

    UserTokenHandler接口的默认实现使用Principal类的实例来表示HTTP连接的状态对象,如果可以从给定的执行上下文中获取。 DefaultUserTokenHandler将使用基于连接的身份验证方案(如NTLM)或启用客户机身份验证的SSL会话的用户主体。 如果两者都不可用,将返回空令牌。

    CloseableHttpClient httpclient = HttpClients.createDefault();
    HttpClientContext context = HttpClientContext.create();
    HttpGet httpget = new HttpGet("http://localhost:8080/");
    CloseableHttpResponse response = httpclient.execute(httpget, context);
    try {
        Principal principal = context.getUserToken(Principal.class);
        System.out.println(principal);
    } finally {
        response.close();
    }

    如果默认处理不能满足Users的需求可以提供一个自定义的实现 :
    UserTokenHandler userTokenHandler = new UserTokenHandler() {
    
        public Object getUserToken(HttpContext context) {
            return context.getAttribute("my-token");
        }
    
    };
    CloseableHttpClient httpclient = HttpClients.custom()
            .setUserTokenHandler(userTokenHandler)
            .build();

    7.2.2. 持久化有状态连接

    请注意,只有在执行请求时将相同的状态对象绑定到执行上下文,才能重用携带状态对象的持久连接。 因此,确保相同的上下文被重用以执行相同用户的后续HTTP请求,或者在请求执行之前将用户令牌绑定到上下文是非常重要的。

    CloseableHttpClient httpclient = HttpClients.createDefault();
    HttpClientContext context1 = HttpClientContext.create();
    HttpGet httpget1 = new HttpGet("http://localhost:8080/");
    CloseableHttpResponse response1 = httpclient.execute(httpget1, context1);
    try {
        HttpEntity entity1 = response1.getEntity();
    } finally {
        response1.close();
    }
    Principal principal = context1.getUserToken(Principal.class);
    
    HttpClientContext context2 = HttpClientContext.create();
    context2.setUserToken(principal);
    HttpGet httpget2 = new HttpGet("http://localhost:8080/");
    CloseableHttpResponse response2 = httpclient.execute(httpget2, context2);
    try {
        HttpEntity entity2 = response2.getEntity();
    } finally {
        response2.close();
    }

    7.3. 使用 FutureRequestExecutionService

    使用FutureRequestExecutionService,您可以调度http呼叫并将响应视为未来。 这在例如 对Web服务进行多次调用。 使用FutureRequestExecutionService的优点是您可以使用多个线程同时调度请求,设置任务超时,或者在不再需要响应时取消它们。

    FutureRequestExecutionService使用HttpRequestFutureTask包装请求,这扩展了FutureTask。 该类允许您取消任务,并跟踪各种指标,例如请求持续时间。

    7.3.1. 创建 FutureRequestExecutionService

    futureRequestExecutionService的构造函数接受任何现有的httpClient实例和ExecutorService实例。 配置两者时,重要的是将最大连接数与要使用的线程数对齐。 当线程多于连接时,由于没有可用连接,连接可能会启动超时。 当连线数超过线程时,futureRequestExecutionService将不会使用它们

    HttpClient httpClient = HttpClientBuilder.create().setMaxConnPerRoute(5).build();
    ExecutorService executorService = Executors.newFixedThreadPool(5);
    FutureRequestExecutionService futureRequestExecutionService =
        new FutureRequestExecutionService(httpClient, executorService);

    7.3.2. Scheduling requests

    要调度一个请求,只需提供一个HttpUriRequest,HttpContext和一个ResponseHandler。 由于请求由执行程序服务处理,所以ResponseHandler是必需的。

    private final class OkidokiHandler implements ResponseHandler<Boolean> {
        public Boolean handleResponse(
                final HttpResponse response) throws ClientProtocolException, IOException {
            return response.getStatusLine().getStatusCode() == 200;
        }
    }
    
    HttpRequestFutureTask<Boolean> task = futureRequestExecutionService.execute(
        new HttpGet("http://www.google.com"), HttpClientContext.create(),
        new OkidokiHandler());
    // blocks until the request complete and then returns true if you can connect to Google
    boolean ok=task.get();

    7.3.3. 取消调度任务

    计划的任务可能会被取消。 如果任务尚未执行,但仅排队等待执行,则将永远不会执行。 如果正在执行,并且将mayInterruptIfRunning参数设置为true,则会在请求中调用abort(); 否则响应将被忽略,但请求将被允许正常完成。 对task.get()的任何后续调用都将失败并带有IllegalStateException。 应该注意的是,取消任务只会释放客户端资源。 请求实际上可以在服务器端正常处理。

    task.cancel(true)
    task.get() // throws an Exception

    7.3.4. Callbacks

    而不是手动调用task.get(),您也可以使用一个FutureCallback实例,该实例在请求完成时获取回调。 这与HttpAsyncClient中使用的界面相同

     
         
    private final class MyCallback implements FutureCallback<Boolean> {
    
        public void failed(final Exception ex) {
            // do something
        }
    
        public void completed(final Boolean result) {
            // do something
        }
    
        public void cancelled() {
            // do something
        }
    }
    
    HttpRequestFutureTask<Boolean> task = futureRequestExecutionService.execute(
        new HttpGet("http://www.google.com"), HttpClientContext.create(),
        new OkidokiHandler(), new MyCallback());

    7.3.5. Metrics

    FutureRequestExecutionService通常用于进行大量Web服务调用的应用程序。 为了方便例如 监视或配置调整,FutureRequestExecutionService跟踪几个mertric。

    每个HttpRequestFutureTask提供方法来获取任务被安排,启动和结束的时间。 此外,请求和任务持续时间也可用。 这些指标汇总在FutureRequestExecutionService中的FutureRequestExecutionMetrics实例中,可以通过FutureRequestExecutionService.metrics()访问。

    task.scheduledTime() // returns the timestamp the task was scheduled
    task.startedTime() // returns the timestamp when the task was started
    task.endedTime() // returns the timestamp when the task was done executing
    task.requestDuration // returns the duration of the http request
    task.taskDuration // returns the duration of the task from the moment it was scheduled
    
    FutureRequestExecutionMetrics metrics = futureRequestExecutionService.metrics()
    metrics.getActiveConnectionCount() // currently active connections
    metrics.getScheduledConnectionCount(); // currently scheduled connections
    metrics.getSuccessfulConnectionCount(); // total number of successful requests
    metrics.getSuccessfulConnectionAverageDuration(); // average request duration
    metrics.getFailedConnectionCount(); // total number of failed tasks
    metrics.getFailedConnectionAverageDuration(); // average duration of failed tasks
    metrics.getTaskCount(); // total number of tasks scheduled
    metrics.getRequestCount(); // total number of requests
    metrics.getRequestAverageDuration(); // average request duration
    metrics.getTaskAverageDuration(); // average task duration


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值