入门

  最近深度学习了下HttpClient 4.5.2,大家都知道,HttpClient 是Apache Jakarta Common 下的子项目,可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包,并且它支持 HTTP 协议最新的版本和建议
  理解不是太深刻,理解错误之处还请指出。废话不多说,开始记录。


使用工具
  • HttpClient 4.5.2
  • maven依赖
    <dependency>
    <groupId>org.apache.httpcomponents</groupId>
    <artifactId>httpclient</artifactId>
    <version>4.5.2</version>
    </dependency>
public static void main(String[] args) {
    // 获取连接客户端工具
    CloseableHttpClient httpClient = HttpClients.createDefault();
    // 创建GET请求对象
    HttpGet httpGet = new HttpGet("https://www.baidu.com");

    String entityStr = null;
    CloseableHttpResponse response = null;

    try {

        // 执行请求
        response = httpClient.execute(httpGet);
        // 获得响应的实体对象
        HttpEntity entity = response.getEntity();
      // 使用Apache提供的工具类进行转换成字符串
        entityStr = EntityUtils.toString(entity);

    } catch (ClientProtocolException e) {
        System.err.println("Http协议出现问题");
        e.printStackTrace();
    } catch (ParseException e) {
        System.err.println("解析错误");
        e.printStackTrace();
    } catch (IOException e) {
        System.err.println("IO异常");
        e.printStackTrace();
    } finally {
        if (null != response) {
            try {
                // 释放连接
                response.close();
                httpClient.close();
            } catch (IOException e) {
                System.err.println("释放连接出错");
                e.printStackTrace();
            }
        }
    }

    // 打印响应内容
    System.out.println(entityStr);
}

  我们平常使用浏览器进行访问网站时,httpClient 就相当于浏览器的一个标签页httpGet 就相当于浏览器上面的每一个超连接。我们需要建立在已经存在标签页的基础上,才能发起一个新的请求。EntityUtils就相当于浏览器的渲染引擎,把服务端响应回来的数据解析出来,当然,这里解析出来的是字符串,而浏览器解析出来的结果是已经渲染好的界面。httpClient的每一次访问都需要开启一个Http连接,而每一个Http连接都是很珍贵的,随意这地方后边会使用连接池进行管理。

  • 打印结果:

乱码结果
  
  上图所示,出现响应结果,但是细心可以发现,有一部分是 乱码显示,这部分为中文乱码

  解决办法是把上面代码中的entityStr = EntityUtils.toString(entity);修改成entityStr = EntityUtils.toString(entity, "UTF-8");指定编码格式解析响应数据即可解决;

  • 打印结果:

正确结果

  • #####关于消耗HTTP实体内容
      HttpClient推荐使用HttpEntity的getConent()方法或者HttpEntity的writeTo(OutputStream)方法来消耗掉Http实体内容。HttpClient也提供了EntityUtils这个类,这个类提供一些静态方法可以更容易地读取Http实体的内容和信息。和以java.io.InputStream流读取内容的方式相比,EntityUtils提供的方法可以以字符串或者字节数组的形式读取Http实体。但是,强烈不推荐使用EntityUtils这个类,除非目标服务器发出的响应是可信任的,并且http响应实体的长度不会过大

  有些情况下,我们希望可以重复读取Http实体的内容。这就需要把Http实体内容缓存在内存或者磁盘上。最简单的方法就是把Http Entity转化成BufferedHttpEntity,这样就把原Http实体的内容缓冲到了内存中。后面我们就可以重复读取BufferedHttpEntity中的内容。

CloseableHttpResponse response = <...>
HttpEntity entity = response.getEntity();
if (entity != null) {
    entity = new BufferedHttpEntity(entity);
}

借鉴:HttpClient 4.3教程

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值