求一正则表达式:
匹配得到的数据:超链接的href,和title(注意:title是指位于"<a>"和"</a>"之间的文字);
匹配条件:1.超链接的href是以"http://a.sina.com/ubs/"开头;
1
2
3
4
5
6
7
|
如:
<a href=
"http://a.sina.com/ubs/1"
>title1</a>
<a href=
"http://a.sina.com/ubs/2"
>title2</a>
匹配结果:
--title--------------------------url--
title1----------------http:
//a.sina.com/ubs/1
title2----------------http:
//a.sina.com/ubs/2
|
foreach(Match m in Regex.Matches(html,@"(?i)<a[^>]*?href=(['""\s]?)(?<href>http://a.sina.com/ubs/[^'""\s]+?\.html)\1[^>]*?>(?<title>[^<>]+)</a>"))