C#中用正则获取网页链接

原创 2007年10月12日 11:49:00

 

using System;
using System.Collections.Generic;
using System.ComponentModel;
using System.Data;
using System.Drawing;
using System.Text;
using System.Windows.Forms;
using System.Text.RegularExpressions;

namespace cs1
...{
    
public partial class Form1 : Form
    
...{
        
public Form1()
        
...{
            InitializeComponent();
            
this.textBox1.Text = "<tr><td><a class='m' href='http://www.csdn.net'>CSDN</a></td><td><a class='m' href='http://blog.csdn.net/precipitant'>塞北的雪</a></td><td><a class='m' href='http://blog.csdn.net/net_lover'>孟子E章</a></td></tr>";
        }


        
private void button1_Click(object sender, EventArgs e)
        
...{
            
string inputString = this.textBox1.Text.Trim();
            StringBuilder sb 
= new StringBuilder();
            Regex reg 
= null;
            Match mch 
= null;

            reg 
= new Regex(@"<a[^<>]*?hrefs*=s*['""s]([^""']*)['""][^<>]*?>(.*?)</a>", RegexOptions.IgnoreCase | RegexOptions.Compiled);
            
for (mch = reg.Match(inputString); mch.Success; mch = mch.NextMatch())
            
...{
                sb.AppendLine(
"网站:" + mch.Groups[2]);
                sb.AppendLine(
"地址:" + mch.Groups[1]);
              
            }

            MessageBox.Show(sb.ToString()) ;
        }

    }

}
 

C#获取当前页面的url

HttpContext.Current.Request.Url.PathAndQuery 1、通过ASP.NET获取 如果测试的url地址是http://www.test.com/testwe...
  • wuhen8
  • wuhen8
  • 2011年11月25日 18:11
  • 31783

C#如何获取网页中的所有超链接地址及详细信息

  • 2011年10月24日 11:19
  • 56KB
  • 下载

C#中使用正则表达式提取超链接地址

一般在做爬虫或者CMS的时候经常需要提取 href链接或者是src地址。此时可以使用正则表达式轻松完成。 方法一: Regex reg = new Regex(@"(?is)]*?href=(['""...
  • hezudao25
  • hezudao25
  • 2013年07月05日 11:39
  • 4453

正则表达式入门知识+用它实现在一个网页中获取所有的链接地址

概念:正则表达式是一种计算机科学的概念、它通常用来检索和替换那些符合规则的文本或者字符串。现在很多的程序设计语言计都支持利用正则表达式来进行字符串的操作,有java、c++、python、javasc...
  • lu93it
  • lu93it
  • 2016年09月14日 08:55
  • 2257

如何提取网页中所有链接

见过“网际快车”的“使用网际快车下载全部链接”这个功能吗?想实现它,我们可以这样做: IE有几个有用的接口,我们可以用它来提取网页所有链接。 一、基本原理 首先是用IHTMLDocu...
  • a1009563517
  • a1009563517
  • 2016年04月11日 17:16
  • 1511

Android 获取网页的视频链接

10.16  青岛      阴       近来,想取某网站的视频做数据源,经别人帮忙爬取了视频链接后发现,视频的连接会在1--2小时后就失效了。经研究发现,每次打开包含视频链接的网页,网页内的视频...
  • a1021508536
  • a1021508536
  • 2016年10月16日 10:31
  • 2312

用正则表达式提取网页中的链接

代码如下:  1    /** *//** The regex for search link with the tag "a" */  2    private final String A...
  • liang0000zai
  • liang0000zai
  • 2014年11月30日 20:32
  • 1054

python获取网页上所有链接

import urllib2 #获取源码的函数,urllib3更换 urllib.request.urlopen(url).read() return urllib2.urlopen(...
  • u013045370
  • u013045370
  • 2016年11月10日 20:41
  • 1214

JSoup获取网页中的链接

在使用JSoup进行网页解析的过程中,我们常常被要求获取网页中的链接。通过查看网页的源代码我们可以发现,网页中的链接一般是作为不同标签的属性来保存的,例如标签a中的href,标签img中的src等。那...
  • yangfeisc
  • yangfeisc
  • 2015年03月10日 15:06
  • 1521

使用Java抓取网页中所有的链接

import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import ...
  • u013510614
  • u013510614
  • 2016年01月08日 10:17
  • 1771
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:C#中用正则获取网页链接
举报原因:
原因补充:

(最多只允许输入30个字)