java读取网页内容乱码_java 读取网页乱码的问题

要读取网页www.bnu.edu.cn的内容,用以下两种方式读取,第一种显示正常,第二种却总是乱码。请问第二种的读取问题出在了哪里?

方法一:

String url = "http://www.bnu.edu.cn";//www.bnu.edu.cn";

URL theUrl= new URL(url);

openStream = theUrl.openStream();

//

//构建输入流的的字符集必须和HTML源码中的 charset一致

bf = new BufferedReader(new InputStreamReader(openStream,"utf-8"));

String line = null;

while((line = bf.readLine())!=null) {

System.out.println(line);

}

方法二:

Socket webClient = new Socket ("www.bnu.edu.cn", 80);

PrintWriter result = new PrintWriter(webClient.getOutputStream(), true);

BufferedReader receiver = new BufferedReader (new InputStreamReader(webClient.getInputStream()));

result.println("GET / HTTP/1.1");

result.println("Host: bnu.edu.cn");

result.println("Connection: Close");

result.println();

boolean bRet = true;

StringBuffer sb = new StringBuffer (8096);

while (bRet) {

if (receiver.ready()) {

int idx = 0;

while (idx!=-1) {

idx = receiver.read();

sb.append((char)idx);

}

bRet = false;

}

}

byte [] b = (sb.toString()).getBytes("UTF-8");//"GBK", "ISO-88591-1";

String str = new String(b,"GB2312");

System.out.println(str);

webClient.close();

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值