java使用HttpURLConnection检索网站时403错误处理方式

java使用HttpURLConnection检索网站时403错误处理方式:

我们通过代码方式访问网站时会报错:



此种情况分2中类型,

1.需要登录才可以访问;

2.需要设置User-Agent来欺骗服务器。

[html]  view plain copy print ?
  1. connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  

User Agent说明:

User Agent中文名为用户代理,简称 UA,它是一个特殊字符串头,使得服务器能够识别客户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言、浏览器插件等。  

一些网站常常通过判断 UA 来给不同的操作系统、不同的浏览器发送不同的页面,因此可能造成某些页面无法在某个浏览器中正常显示,但通过伪装 UA 可以绕过检测。

java访问网站代码:

[java]  view plain copy print ?
  1.     /** 
  2.      *  发起http get请求获取网页源代码  
  3.      * @param requestUrl 
  4.      * @param isUserAgent 是否设置欺骗服务器 
  5.      * @return 
  6.      */  
  7.        
  8.     public static String httpRequest(String requestUrl,boolean isUserAgent) {    
  9.         StringBuffer buffer = null;    
  10.     
  11.         try {    
  12.             // 建立连接    
  13.             URL url = new URL(requestUrl);    
  14.             HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();    
  15.             httpUrlConn.setDoInput(true);    
  16.             httpUrlConn.setRequestMethod("GET");    
  17.             if(isUserAgent){  
  18.                 httpUrlConn.setRequestProperty("User-Agent""Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");  
  19.             }  
  20.             // 获取输入流    
  21.             InputStream inputStream = httpUrlConn.getInputStream();    
  22.             InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "utf-8");    
  23.             BufferedReader bufferedReader = new BufferedReader(inputStreamReader);    
  24.     
  25.             // 读取返回结果    
  26.             buffer = new StringBuffer();    
  27.             String str = null;    
  28.             while ((str = bufferedReader.readLine()) != null) {    
  29.                 buffer.append(str);    
  30.             }    
  31.         } catch (Exception e) {    
  32.             e.printStackTrace();    
  33.         }finally{  
  34. <pre name="code" class="java">            // 释放资源    
  35.             bufferedReader.close();    
  36.             inputStreamReader.close();    
  37.             inputStream.close();    
  38.             httpUrlConn.disconnect();    
        } return buffer.toString(); }
 

执行结果:顺利获取到网页代码。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值