Java使用HttpURLConnection检索网站时403错误处理方式

Java使用HttpURLConnection检索网站时403错误处理方式:

我们通过代码方式访问网站时会报错:



此种情况分2中类型,

1.需要登录才可以访问;

2.需要设置User-Agent来欺骗服务器。

[html]  view plain copy print ?
  1. connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  

User Agent说明:

User Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。  

一些网站常常通过判断 UA 来给不同的操作系统、不同的浏览器发送不同的页面,因此可能造成某些页面无法在某个浏览器中正常显示,但通过伪装 UA 可以绕过检测。

java访问网站代码:

[java]  view plain copy print ?
  1. /** 
  2.  *  发起http get请求获取网页源代码  
  3.  * @param requestUrl 
  4.  * @param isUserAgent 是否设置欺骗服务器 
  5.  * @return 
  6.  */  
  7.    
  8. public static String httpRequest(String requestUrl,boolean isUserAgent) {    
  9.     StringBuffer buffer = null;    
  10.   
  11.     try {    
  12.         // 建立连接    
  13.         URL url = new URL(requestUrl);    
  14.         HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();    
  15.         httpUrlConn.setDoInput(true);    
  16.         httpUrlConn.setRequestMethod("GET");    
  17.         if(isUserAgent){  
  18.             httpUrlConn.setRequestProperty("User-Agent""Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  
  19.         }  
  20.         // 获取输入流    
  21.         InputStream inputStream = httpUrlConn.getInputStream();    
  22.         InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "utf-8");    
  23.         BufferedReader bufferedReader = new BufferedReader(inputStreamReader);    
  24.   
  25.         // 读取返回结果    
  26.         buffer = new StringBuffer();    
  27.         String str = null;    
  28.         while ((str = bufferedReader.readLine()) != null) {    
  29.             buffer.append(str);    
  30.         }    
  31.   
  32.         // 释放资源    
  33.         bufferedReader.close();    
  34.         inputStreamReader.close();    
  35.         inputStream.close();    
  36.         httpUrlConn.disconnect();    
  37.     } catch (Exception e) {    
  38.         e.printStackTrace();    
  39.     }    
  40.     return buffer.toString();    
  41. }    

执行结果:顺利获取到网页代码。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值