HttpClient 爬接口报 Input length = 1

使用HttpClient爬取接口时遇到`Input length = 1`错误,由于响应Header中`Set-Cookie`字段含有不合法字符,导致编码问题。尝试从utf-8更改为gbk、gb2312后解决了MalformedInputException,但随后又出现Invalid cookie header,原因是不正确的expires格式。解决方法是自定义cookieSpec,提供相关代码以供参考。
摘要由CSDN通过智能技术生成

HttpClient 爬接口报 Input length = 1

调试时发现响应的header有条
Set-Cookie: security_session_verify=cad9721cc133dd9d4646bb8913a27e44; expires=��, 28- 6��-19 15:43:50 GMT; path=/; HttpOnly;
当时初始化的HttpClient编码为utf-8,

  ConnectionConfig connCfg		= ConnectionConfig.custom().setCharset(Charset.forName("utf-8")).build();																
  HttpClientBuilder clientBuilder	= HttpClients.custom()
    										.setConnectionManager(connManager)
    										.setDefaultRequestConfig(defaultRequestConfig)
    										.setDefaultConnectionConfig(connCfg);

包含不合法字符导致读头的时候报java.nio.charset.MalformedInputException: Input length = 1
最后尝试下改换gbk,gb2312,终于不报length=1了.
本以为解决了,结果调试发现cookie 解析会报Invalid cookie header导致丢弃,原来解决乱码后expires=四, 27- 6月-19 20:57:11 GMT,这其实也不是正确的expires格式.
这个时候就得重写cookieSpec了,贴上代码供参考

public cl
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值