C#正则表达试来读取网页所有内容里的链接地址和链接内容

完成C#代码:
能够对html网页内容进行正则配对,把正则网页里的所有链接和链接内容查找出来:
C# Code 复制内容到剪贴板
  1. static void Main(string[] args)  
  2.         {  
  3.             string pattern = "<(a|A)\\s*(href|HREF)\\s*=\\s*(['\"])(?'LinkUri'[^']+)\\3[^>]*>\\s*(?'LinkTitle'[^\\<]+)\\s*</\\1>";  
  4.             string source = @"<li> 
  5.                     <a href='http://163.com'> 网易 </a> 
  6.                     </li> 
  7.                     <li> 
  8.                     <a href='http://www.google.com'>Google </a> 
  9.                     </li>";  
  10.   
  11.             Regex reg = new Regex(pattern, RegexOptions.Compiled);  
  12.             Match m = reg.Match(source);  
  13.             while (m.Success)  
  14.             {  
  15.                 string linkUri = m.Groups["LinkUri"].Value;  
  16.                 string LinkTitle = m.Groups["LinkTitle"].Value;  
  17.                 m = m.NextMatch();  
  18.             }  
  19.         }  
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值