jsp获取某网站所有链接地址

原创 2007年09月27日 13:30:00
<%@ page contentType="text/html; charset=gb2312" language="java"
    import="java.util.regex.*" errorPage=""%>
<%
    String sCurrentLine;
    String sTotalString;
    sCurrentLine = "";
    sTotalString = "";
    java.io.InputStream l_urlStream;
    java.net.URL l_url = new java.net.URL("http://www.baidu.com");
    java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
            .openConnection();
    l_connection.connect();
    l_urlStream = l_connection.getInputStream();
    java.io.BufferedReader l_reader = new java.io.BufferedReader(
            new java.io.InputStreamReader(l_urlStream));

    while ((sCurrentLine = l_reader.readLine()) != null) {
        sTotalString += sCurrentLine;
    }
    //String regEx = "href=([^/"']*)>";
    String regEx = "href=/"([^/"]*)/"";//找出href="****"的链接
    Pattern p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    Matcher m = p.matcher(sTotalString);
    int j = 0;
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
    regEx = "href='([^']*)'";//找出href='****'的链接
    p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
    m = p.matcher(sTotalString);
    while (m.find()) {
        j++;
        out.println("m.group(" + j + "): " + m.group(0) + "<br>");
    }
   

%>
 

jsp获取当前页面的链接地址

在需要的地方加上
  • immenselee
  • immenselee
  • 2017年05月26日 17:27
  • 1092

C#正则表达试来读取网页所有内容里的链接地址和链接内容

完成C#代码: 能够对html网页内容进行正则配对,把正则网页里的所有链接和链接内容查找出来: C# Code复制内容到剪贴板 static void Main(string...
  • xtfgha
  • xtfgha
  • 2014年04月05日 18:52
  • 351

C#获取某个URL下网页的方法

该方法使用到了类HttpWebRequest
  • liucheng5037
  • liucheng5037
  • 2014年06月05日 13:39
  • 912

js获取链接地址

由于要把推荐链接由原来的静态转化为数据库,所以要获取该页面的链接地址及内容。 var obj=document.getElementsByTagName("a");    for(var i = 0;...
  • beimuaihui
  • beimuaihui
  • 2007年04月24日 10:17
  • 1321

获取网页内所有图片地址

打开页面,当页面全部载入完毕后,从地址栏 运行,以下code中的javascript:.........那个即可。。 window.onload = function () {    (functio...
  • muxrwc
  • muxrwc
  • 2007年09月12日 12:00
  • 1270

python3 beautifulsoup查找网页中的链接

soup=BeautifulSoup(html, "html.parser") a=soup.find_all('img',attrs={'pic_type':'0','class':'BDE...
  • sikuquanshu123
  • sikuquanshu123
  • 2016年02月17日 22:07
  • 189

获取指定URl页面中所有链接

获取指定URl页面中所有链接
  • zhaozonglu
  • zhaozonglu
  • 2015年08月28日 22:05
  • 997

一行JavaScript代码获取页面中的所有超链接地址

分析网页内容,然后提取自己需要的信息,这些难道都非得使用服务器端语言来编程实现吗? 不一定吧,对于不是很复杂的需求,其实,使用前端编程就能实现,今天我就使用JavaScript实现 了我提取某个网页中...
  • kingwolf_JavaScript
  • kingwolf_JavaScript
  • 2013年09月12日 23:51
  • 2648

jsp页面获取网站部署根目录的两个方法

1.在 jsp头部   然后就可以${ctx}引用 2.
  • u013476542
  • u013476542
  • 2017年03月28日 07:53
  • 1125

jsp 如何获取表格某一行中的数据

链接:http://bbs.csdn.net/topics/370184131 1.使用标签 2.使用javascript  button标签  直接onclick=" "中写事件并带上标...
  • ahqierlian
  • ahqierlian
  • 2017年08月28日 18:51
  • 692
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:jsp获取某网站所有链接地址
举报原因:
原因补充:

(最多只允许输入30个字)