Java读取网页HTML 汉字乱码 (已解决，bufferedReader中编码改成跟网页的一致即可)

最新推荐文章于 2021-03-14 23:02:00 发布

JEFFYU328

最新推荐文章于 2021-03-14 23:02:00 发布

阅读量1.1k

点赞数 1

分类专栏： java基础

本文链接：https://blog.csdn.net/JEFFYU328/article/details/108467519

版权

#网页HTML的编码是gb2312

<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

#Java用utf-8 读取汉字乱码，读取网页HTML内容后输出汉子乱码
乱码截图

 URLConnection urlConnection = new URL(url).openConnection();
        HttpURLConnection connection = (HttpURLConnection) urlConnection;
        connection.setRequestMethod("GET");
        //连接
        connection.connect();
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader
                    (connection.getInputStream(), StandardCharsets.UTF_8));
            StringBuilder bs = new StringBuilder();
            String l;
            while ((l = bufferedReader.readLine()) != null) {
                if(l.indexOf("<P align=center><IMG style=")>-1){
                    System.out.println(l)

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

JEFFYU328

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
Java读取网页HTML 汉字乱码 (已解决，bufferedReader中编码改成跟网页的一致即可)

#网页HTML的编码是gb2312<meta http-equiv="Content-Type" content="text/html; charset=gb2312">#Java用utf-8 读取汉字乱码，读取网页HTML内容后输出汉子乱码 URLConnection urlConnection = new URL(url).openConnection(); HttpURLConnection connection = (HttpURLConnection) url
复制链接

扫一扫