Java爬取中文字符结果是乱码解决方法

最新推荐文章于 2023-03-25 22:59:44 发布

dlz456

最新推荐文章于 2023-03-25 22:59:44 发布

阅读量1.1k

点赞数

分类专栏： Java爬虫

本文链接：https://blog.csdn.net/dlz_yhn/article/details/118614857

版权

Java爬虫专栏收录该内容

5 篇文章 2 订阅

订阅专栏

做java网络爬虫，爬取网页html代码，结果里面的字符倒是可以正常显示，汉字却显示成一堆乱码

错误代码：

 if(responseCode == HttpURLConnection.HTTP_OK){
	                //得到响应流
	                InputStream inputStream = connection.getInputStream();
	                //获取响应
	                BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
	                String returnStr = "";
	                String line;
	                while ((line = reader.readLine()) != null){
	                    returnStr+=line + "\r\n";
	                }
	     
	                reader.close();
	                inputStream.close();
	                connection.disconnect();
	                System.out.println(returnStr);

解决方法：就在构造InputStreamReader对象时添加了一个参数"UTF-8"

正确代码：

if(responseCode == HttpURLConnection.HTTP_OK){
	                //得到响应流
	                InputStream inputStream = connection.getInputStream();
	                //获取响应
	                BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream,"UTF-8"));
	                String returnStr = "";
	                String line;
	                while ((line = reader.readLine()) != null){
	                    returnStr+=line + "\r\n";
	                }
	                
	                reader.close();
	                inputStream.close();
	                connection.disconnect();
	                System.out.println(returnStr);

然后就🆗了，汉字可以正常显示了

dlz456

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Java爬取中文字符结果是乱码解决方法

做java网络爬虫，爬取网页html代码，结果里面的字符倒是可以正常显示，汉字却显示成一堆乱码错误代码： if(responseCode == HttpURLConnection.HTTP_OK){ //得到响应流 InputStream inputStream = connection.getInputStream(); //获取响应 BufferedRea
复制链接

扫一扫

专栏目录