关闭

jsp获取某网站所有链接地址

652人阅读 评论(0) 收藏 举报
<%@ page contentType="text/html; charset=gb2312" language="java"
    import="java.util.regex.*" errorPage=""%>
<%
    String sCurrentLine;
    String sTotalString;
    sCurrentLine = "";
    sTotalString = "";
    java.io.InputStream l_urlStream;
    java.net.URL l_url = new java.net.URL("http://www.baidu.com");
    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
            .openConnection();
    l_connection.connect();
    l_urlStream = l_connection.getInputStream();
    java.io.BufferedReader l_reader = new java.io.BufferedReader(
            new java.io.InputStreamReader(l_urlStream));

    while ((sCurrentLine = l_reader.readLine()) != null) {
        sTotalString += sCurrentLine;
    }
    //String regEx = "href=([^/"']*)>";
    String regEx = "href=/"([^/"]*)/"";//找出href="****"的链接
    Pattern p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    Matcher m = p.matcher(sTotalString);
    int j = 0;
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
    regEx = "href='([^']*)'";//找出href='****'的链接
    p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
    m = p.matcher(sTotalString);
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
   

%>
 
0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:10768次
    • 积分:199
    • 等级:
    • 排名:千里之外
    • 原创:10篇
    • 转载:0篇
    • 译文:0篇
    • 评论:2条
    最新评论