httpclient编码问题（未完成）

最新推荐文章于 2023-04-24 17:05:20 发布

poplarbbs

最新推荐文章于 2023-04-24 17:05:20 发布

阅读量175

点赞数

分类专栏： Java 文章标签： OpenSource Ruby OS IBM 浏览器

Java 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

最近在做一个httpClient模拟动态操作Web的功能。很正常的遇到了乱码问题，开始没有弄清楚乱码的原因走了很多弯路。终于解决了，记录备忘一下。

首先http响应的编码有两个部分，response头里的参数和页面开头的meta信息。其实浏览器首先是针对response头来设置页面charset的。httpClient模拟页面也是采用相同方式。所以其实乱码跟meta无关。

我们知道String－GBK〉ByteArray－GBK〉String是正确的，但如果我们采用String－GBK〉ByteArray－ISO-8859-1〉String呢？结果就是各种各样的乱码。

所以当httpClient用iso-8859-1读取response的时候已经转换了编码，很可能在这时已经乱码了。此时如果用method.getResponseBodyAsString();获取页面信息的时候再进行转换已经很难还原了。

通常如果要转换编码的时候，我会使用：


String target = new String(orig.getBytes("ISO-8859-1"),"GBK");

解决办法就是使用以下配置。


private static final String CONTENT_CHARSET = "GBK";// httpclient读取内容时使用的字符集

HttpClient client = new HttpClient();
    client.getParams().setParameter(
      HttpMethodParams.HTTP_CONTENT_CHARSET, CONTENT_CHARSET);

其他资料：
http://hi.baidu.com/beyond456/blog/item/1798bfa1607d25884610646c.html
http://www.itpub.net/693874.html
http://www.ibm.com/developerworks/cn/opensource/os-httpclient/
http://read.newbooks.com.cn/info/52828.html

poplarbbs

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
httpclient编码问题（未完成）

最近在做一个httpClient模拟动态操作Web的功能。很正常的遇到了乱码问题，开始没有弄清楚乱码的原因走了很多弯路。终于解决了，记录备忘一下。首先http响应的编码有两个部分，response头里的参数和页面开头的meta信息。其实浏览器首先是针对response头来设置页面charset的。httpClient模拟页面也是采用相同方式。所以其实乱码跟meta无关。我们知道St...
复制链接

扫一扫

专栏目录