jsp获取某网站所有链接地址

<%@ page contentType="text/html; charset=gb2312" language="java"
    import="java.util.regex.*" errorPage=""%>
<%
    String sCurrentLine;
    String sTotalString;
    sCurrentLine = "";
    sTotalString = "";
    java.io.InputStream l_urlStream;
    java.net.URL l_url = new java.net.URL("http://www.baidu.com");
    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
            .openConnection();
    l_connection.connect();
    l_urlStream = l_connection.getInputStream();
    java.io.BufferedReader l_reader = new java.io.BufferedReader(
            new java.io.InputStreamReader(l_urlStream));

    while ((sCurrentLine = l_reader.readLine()) != null) {
        sTotalString += sCurrentLine;
    }
    //String regEx = "href=([^/"']*)>";
    String regEx = "href=/"([^/"]*)/"";//找出href="****"的链接
    Pattern p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    Matcher m = p.matcher(sTotalString);
    int j = 0;
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
    regEx = "href='([^']*)'";//找出href='****'的链接
    p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
    m = p.matcher(sTotalString);
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
   

%>
 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值