C#正则学习杂谈(二)

三、正则中几个难点
1、贪婪与非贪婪
  注意在谈到贪婪与非贪婪时,有一点大家可能会忽略,那就是单独的一个“?”,表示的是贪婪模式,而“??”才是非贪婪模式。 举例: 源字符串:12 正则表达式(一):[1-9]/d? 正则表达式(二):[1-9]/d?? 结果:(一)匹配成功,匹配结果为12,(二)匹配成功,匹配结果为1
 
2、正向预搜索和反向预搜索
四、正则的几种常见用法
1、验证控件 RegularExpressionValidator
注意1、RegularExpressionValidator不能验证非空,验证非空用RequiredFieldValidator,名司其职
2、如无特殊情况,用于验证控件的正则前后分别要加“^”和“$”,因为用验证控件来验证的内容是要完全匹配的,而不是成功匹配其中一部分即可通过验证
3、用于验证控件的正则,最后都要转换为客户端脚本,而由于脚本语言对正则的支持较弱,有些在cs程序里可以通过的正则,在验证控件里可能失效
2、匹配
匹配就是检查字符串是否满足某一规律,或是否包含符合某一规律的子字符串
Regex.IsMatch
举例判断textBox1输入内容是否为yyyy-MM格式
stringyourStr=textBox1.Text; if(Regex.IsMatch(yourStr,@"^/d{4}-(0/d|1[0-2])$")) { MessageBox.Show("符合"); } else { MessageBox.Show("不符合"); }
3、提取
提取就是从字符串中取出符合某一规律的子字符串
Match m = Regex.Match
MatchCollection mc = Regex.Matches
前者用来取出单一匹配结果,后者用来取出多个匹配结果,并存入集合
举例取出单个图片地址
string yourStr = "<img src=/"http://www.ahelp.cn/bbs/UploadFile/2006-8/200681516161698723.jpg/" border=/"0/" alt=/"/"/>"; stringresultStr=""; Matchm=Regex.Match(yourStr,@"<img/s[^>]*?src=([""']?)(?<source>[^""'/s]*)/1[^>]*?>",RegexOptions.IgnoreCase); if(m.Success) { resultStr=m.Groups["source"].Value; }
取出多个图片地址
stringyourStr="<p><imgsrc=/"http://www.ahelp.cn/bbs/UploadFile/2006-8/200681516161698723.jpg/"border=/"0/"alt=/"/"/></p><p>&nbsp;</p><p><imgsrc=/"http://www.ahelp.cn/bbs/UploadFile/2006-8/200681516194447448.jpg/"border=/"0/"alt=/"/"/></p><p>&nbsp;</p><imgsrc=/"http://photo.bababian.com/20060803/C97D6403CD4F2F85A5FBB57D5A791F5B_500.jpg/"border=/"0/"alt=/"/"/>"; MatchCollectionmc=Regex.Matches(yourStr,@"<img/s[^>]*?src=([""']?)(?<src>[^""'/s]*)/1[^>]*?>",RegexOptions.IgnoreCase); foreach(Matchminmc) { richTextBox2.Text+=m.Groups["src"].Value+"/n"; }
有助于理解这一概念的帖子 http://community.csdn.net/Expert/topic/5479/5479400.xml?temp=.2616083
4、替换
替换就是将一种形式的字符串替换为另一种形式,或是删除不需要的内容
Regex.Replace 举例将UBB代码转换为html格式
stringtest="[img]http://www.csdn.net/logo.jpg[/img]"; stringresultStr=Regex.Replace(test,@"/[img/]([^/]]*?)/[/img/]",@"<imgsrc=""$1"">");
输出为:<img src="http://www.csdn.net/logo.jpg">举例取出<td>...</td>标签内非html代码部分
stringtest="<TDCLASS=btdWIDTH=198BGCOLOR=/"#FCFCFC/"><B>  <ahref=/"http://dict.pconline.com.cn/dic/sort.jsp?kindId=-1&dicId=3142/"target=/"_blank/">显示屏类型</a></B></TD>"; stringresultStr=Regex.Replace(test,@"<[^>]*?>","").Trim();
输出为:显示屏类型
5、分割
Regex.Split
注意在Split中使用捕获组,分割后的数组也包含捕获组的内容,即使使用零宽度捕获组,仍然会将捕获组的内容保存到结果数组内
举例不存在捕获组时
stringtest="aa<bbb>cc<ddd>ee"; string[]temp=Regex.Split(test,@"<[^>]*?>"); foreach(stringsintemp) { richTextBox2.Text+=s+"/n"; }
输出为: aa cc ee 存在捕获组时
stringtest="aa<bbb>cc<ddd>ee"; string[]temp=Regex.Split(test,@"(<[^>]*?>)"); foreach(stringsintemp) { richTextBox2.Text+=s+"/n"; }
输出为: aa <bbb> cc <ddd> ee有助于理解这一概念的帖子 http://community.csdn.net/Expert/topic/5436/5436187.xml?temp=.7995264 6、委托 正则中的委托,有时候可以很优雅的解决某一类问题,或是提高效率
委托一般用在对符合某一条件的子字符串进行处理,而不是处理所有 MatchEvaluator(string (Match) target) 举例只替换<B>...</B>标签内不包含html代码的部分为CRT
privatevoidbutton2_Click(objectsender,EventArgse) { string yourStr = "<TD CLASS=btd WIDTH=198 BGCOLOR=/"#FCFCFC/"><B>  <a href=/"http://dict.pconline.com.cn/dic/sort.jsp?kindId=-1&dicId=3142/" target=/"_blank/">显示屏类型</a></B> <B> WUXGA+</B></TD>"; string resultStr = Regex.Replace(yourStr, @"(?<=<b[^>]*>)[^<>]*(?=</b>)", new MatchEvaluator(expReplace), RegexOptions.IgnoreCase); } privatestringexpReplace(Matchm) { returnm.Value.Replace(m.Value, "CRT"); }
输出为:<TD CLASS=btd WIDTH=198 BGCOLOR="#FCFCFC"><B>  <a href="http://dict.pconline.com.cn/dic/sort.jsp?kindId=-1&dicId=3142" target="_blank">显示屏类型</a></B> <B>CRT</B></TD>有助于理解这一概念的帖子 http://community.csdn.net/Expert/topic/5520/5520530.xml?temp=.769314 http://community.csdn.net/Expert/topic/5580/5580796.xml?temp=.6849176 http://community.csdn.net/Expert/topic/5578/5578425.xml?temp=.2284815
阅读更多
换一批

没有更多推荐了,返回首页