关于重定向页面下载的办法

 

页面重定向一般有两个页面,第一个页面是引导页,利用meta标签的HTTP-EQUIV=REFRESH重新获得新的页面地址。所以可以用一个页面标签解释的办法来取得新的页面地址。

我们采用一个正则表达式:

String express = "HTTP-EQUIV//s*=//s*/"*REFRESH/"*([^>]*)URL//s*=//s*([^>]*)>";

来匹配引导页。如果匹配到有定向标签的就取得标签中的url,处理相对地址变为绝对地址,然后再下载这个地址的页面,这个过程可以迭代,直到没有匹配到定向标签,最后下载到的页面为最终页面。

 

例子代码:

  private boolean tryRedirect(StringBuffer sb){

    String text = sb.toString();//取得页面正文

    if(matcher.contains(text,pattern)){//如果匹配表达式成功

      MatchResult result = matcher.getMatch();

      String url = result.group(2);//取得标签里面的新地址

      url = url.trim();

      if(url.charAt(url.length()-1)=='/''){

        url = url.substring(0,url.length()-1);

      }

      if(url.charAt(url.length()-1)=='/"'){

        url = url.substring(0,url.length()-1);

    }

      //转换相对地址为绝对地址

    currentURL=com.westwind.infogate.util.URLProcess.RelativelyToFull(url,currentURL);

    if(currentURL==null)

      return false;

    currentURL = URLProcess.addHttphead(currentURL);

    return true;

  }

 return false;

}

 

  • 0
    点赞
  • 0
    收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
©️2022 CSDN 皮肤主题:大白 设计师:CSDN官方博客 返回首页
评论

打赏作者

gdsean

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值