href 一个正则表达式的解析 ? 号解析

 

None.gif ArrayList linkLocal     =   new  ArrayList(); 
None.gifArrayList linkExternal 
=   new  ArrayList(); 
None.gif
//  Dodgy Regex will find *some* links 
None.gif
foreach  (Match match  in  Regex.Matches(htmlData 
None.gif    , 
@" (?<=<(a|area)\s+href="").*?(?=""\s*/?>) "  
ExpandedBlockStart.gifContractedBlock.gif    , RegexOptions.IgnoreCase
| RegexOptions.ExplicitCapture))  dot.gif
InBlock.gif
InBlock.gif    
// Regex matches from opening "quote
InBlock.gif
    link = match.Value;
InBlock.gif    
// find first space (ie no spaces in Url)
InBlock.gif
    int spacePos = link.IndexOf(' ');
InBlock.gif    
// or first closing quote (NO single quotes) 
InBlock.gif
    int quotePos = link.IndexOf('"');
InBlock.gif    
int chopPos = (quotePos<spacePos?quotePos:spacePos);
ExpandedSubBlockStart.gifContractedSubBlock.gif    
if (chopPos > 0dot.gif{
InBlock.gif    
// chopPos if quote or space first the at URL end
InBlock.gif
        link = link.Substring(0,chopPos);
ExpandedSubBlockEnd.gif    }
 
InBlock.gif    
if ( (link.Length > 8&& 
ExpandedSubBlockStart.gifContractedSubBlock.gif         (link.Substring(
07).ToLower() == "http://") ) dot.gif{
InBlock.gif        
// Assumes all links beginning with http:// are _external_ 
InBlock.gif
        linkExternal.Add(link) ; 
ExpandedSubBlockStart.gifContractedSubBlock.gif    }
 else dot.gif
InBlock.gif        
// otherwise they're "relative"/internal links
InBlock.gif        
// so we concatenate the base URL 
InBlock.gif
        link = startingUrl + link; 
InBlock.gif        linkLocal.Add(link); 
ExpandedSubBlockEnd.gif    }
 
ExpandedBlockEnd.gif}

None.gif

 

.*? 非贪婪或最小匹配.
?<= 正向引用不包含在匹配值里
?= 同上.. (不过上面的哪个没有了<号就会造成不同的结果了)
"" 因为前面加了个@ 所以这边的""变成了"的意思.
(a|area) 其它的任意一个

RegexOptions.ExplicitCapture 指得没有命名的不能捕获..其它?<=和?=以经代替了它的作用了

另一种方法的捕狱.括号加命名 (?<banyi>.*?)到时候就可以match.Groups["banyi"].Value这种形式来获得了 Replace的时候也可以指定的
?的另一个作用就是 匹配0次或一次了 +号是一次或多次*号是0次或多次

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值