java 抓取网页乱码_java抓取网页乱码问题的处理

今天同事做了一个我们感觉很牛B的彩票预测程序,采用的是遗传算法实现,于是我“剽”来学习先,但是部署到我电脑上以后,就有问题了:

1、用她的抓取程序得到的网页内容出现乱码,导致数据无法解析,苦思不得其解,今天终于在一个牛人的博客上得到正果,哈哈,抓取数据成功。

一下是处理java抓取网页乱码的解决方案,我这里测试通过哦。

java 抓取网页乱码问题处理

String htmlContent = "";

java.io.InputStream inputStream;

java.net.URL url = new java.net.URL("www.csdn.net ");

java.net.HttpURLConnection connection = (java.net.HttpURLConnection) url.openConnection();

connection.connect();

inputStream = connection.getInputStream();

byte bytes[] = new byte[1024*100];

int index = 0;

int count = inputStream.read(bytes, index, 1024*100);

while (count != -1) {

index += count;

count = inputStream.read(bytes, index, 1);

}

System.out.println (count);

htmlContent = new String(bytes, "gb2312");//

System.out.println(htmlContent);

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值