httpclient 字符编码问题

在使用HttpClient过程中常见的一些问题。
字符编码
某目标页的编码可能出现在两个地方,第一个地方是服务器返回的http头中,另外一个地方是得到的html/xml页面中。
在http头的Content-Type字段可能会包含 字符编码信息。例如可能返回的头会包含这样子的信息:Content-Type: text/html; charset=UTF-8。这个头信息表明该页的编码是UTF-8,但是服务器返回的头信息未必与内容能匹配上。比如对于一些双 字节语言国家,可能服务器返回的编码类型是UTF-8,但真正的内容却不是UTF-8编码的,因此需要在另外的地方去得到页面的编码信息;但是如果服务器返回的编码不是UTF-8,而是具体的一些编码,比如gb2312等,那服务器返回的可能是正确的编码信息。通过method对象的getResponseCharSet()方法就可以得到http头中的编码信息。

设置在http头的Content-Type的字符编码:httpClient.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET, "UTF-8");


对于象xml或者html这样的文件,允许作者在页面中直接指定编码类型。比如在html中会有<meta http-equiv="Content-Type" content="text/html; charset=gb2312"/>这样的标签;或者在xml中会有<?xml version="1.0" encoding="gb2312"?>这样的标签,在这些情况下,可能与http头中返回的编码信息冲突,需要用户自己判断到底那种编码类型应该是真正的编码。

可能有效:String ret = new String(postMethod.getResponseBodyAsString().getBytes("UTF-8"));
### 回答1: Httpclient返回值乱码可能是由于编码问题引起的。可以尝试在请求头中设置字符编码,例如: ``` HttpGet httpGet = new HttpGet(url); httpGet.setHeader("Content-Type", "text/html;charset=utf-8"); HttpResponse response = httpClient.execute(httpGet); ``` 另外,也可以尝试将返回值使用正确的编码进行解码,例如: ``` String result = EntityUtils.toString(response.getEntity(), "utf-8"); ``` 如果以上方法仍然无法解决问题,可能还需要检查服务器端的编码设置是否正确。 ### 回答2: 当使用HttpClient发送请求时,可能会遇到返回值乱码的情况。这通常是由于服务器返回的数据编码与我们所期望的不一致导致的。 解决这个问题的方法有以下几种: 1. 设置字符编码:可以通过设置字符编码来指定HttpClient接收数据时所使用的编码方式。例如,可以使用`httpClient.getParams().setParameter(CoreProtocolPNames.HTTP_CONTENT_CHARSET, "UTF-8")`来指定字符集为UTF-8。 2. 手动转换字符编码:如果服务器返回的数据编码无法通过设置字符编码解决,可以使用`EntityUtils.toString(HttpEntity entity, String charset)`方法手动将数据转换成所需的字符编码。 3. 使用StringEntity或ByteArrayEntity:可以通过创建StringEntity或ByteArrayEntity对象来指定发送数据的编码方式。例如,可以使用`StringEntity entity = new StringEntity("请求内容", "UTF-8")`来指定请求内容的编码为UTF-8。 4. 设置请求头部信息:可以通过设置请求头部信息来告知服务器所需的数据编码方式。例如,可以使用`httpPost.setHeader("Content-Type", "text/html; charset=UTF-8")`来告知服务器请求数据的编码为UTF-8。 综上所述,通过设置字符编码、手动转换字符编码、使用StringEntity或ByteArrayEntity以及设置请求头部信息等方法,可以解决HttpClient返回值乱码的问题。当然,具体的方法需要根据实际情况来选择和调整。 ### 回答3: 当我们使用HttpClient发送请求并接收响应时,有时候会遇到返回值乱码的问题。这种情况通常是由于接收到的响应内容的字符编码与我们预期的不一致导致的。 解决这个问题的方法有以下几种: 1. 指定字符编码: 可以通过在HttpClient发送请求之前,设置字符编码来解决乱码问题。例如,可以使用`URLEncoder`对请求参数进行编码,或者使用`HttpEntity`的`getContentEncoding`方法获取响应实体的字符编码,并将其应用于解析响应内容。 2. 使用HttpClient的StringEntity类: 如果返回值是一个字符串,可以使用HttpClient的`StringEntity`类将其转换成指定编码字符串。例如,可以使用以下方式将响应内容进行编码: ``` StringEntity entity = new StringEntity(response, StandardCharsets.UTF_8); ``` 3. 设置响应头: 在HttpClient发送请求之前,可以设置Accept-Encoding请求头,指定可接受的编码类型。例如,可以使用以下方式设置请求头: ``` httpGet.setHeader("Accept-Encoding", "gzip,deflate"); ``` 这样,服务器将会以gzip或deflate编码方式返回响应内容,我们需要在接收响应时进行解码。 4. 使用第三方库: 如果以上方法仍然无法解决乱码问题,可以考虑使用第三方库来解析返回值。例如,可以使用Jsoup库对HTML进行解析,或者使用JSON库来解析JSON格式的返回值。 无论使用哪种方法,我们需要确保发送请求和接收响应时使用的字符编码一致,并根据实际情况进行适当的编码和解码操作,才能正确处理返回值乱码的问题
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值