之前使用C#正则,只会用Match.Value,不能说不好用,但是总感觉差那么一点。
比如提取xml的属性是时候` <select id="getUpdateDate">`,
var str = "<select id=\"getUpdateDate\">";
var id = Regex.Match(str, "\".*?\"").Value;
很显然取得的id是"getUpdateDate",注意是带引号的,我想要的是不带引号的结果,所以引号还得再取一下。
如果使用Result函数的话
var str = "<select id=\"getUpdateDate\">";
var id = Regex.Match(str, "\"(.*?)\"").Result("$1");
取得的id是getUpdateDate,注意是不带引号的,一步到位。
1. $1替换
然后就进入主题,就是正则替换。先上代码:
var pattern = @"\p{Sc}*(\s?\d+[.]?\d*)";
var replacement = "$1";
var input = "$16.32 £16.29 €18.29 ¥15.31";
var result = Regex.Replace(input, pattern, replacement);
字符串input是各种货币符号和数字的组合。需求是把货币符号去掉,只保留数值。
正常考虑是一个个货币符号,逐个Replace,那么input字符串需要Replace4次。很显然效率很低,方式不可取。
使用上述代码直接可以得到结果:16.32 16.29 18.29 15.31。
2. $$ 替换
能去掉自然也能加上,给16.32 16.29 18.29 15.31再加上货币符号,上代码
var str = "16.32 16.29 18.29 15.31";
var pattern = @"\b(\d+)(.(\d+))?";
var replacement = "$ $1$2";
var result = Regex.Replace(str, pattern, replacement);
替换的结果是$16.32 $16.29 $18.29 $15.31。
3. $+ 替换
有时候字符串内部去重就很头疼 ,比如 "the the dog jumped over the fence fence." 其中the重复了
fence也重复了。以下代码可以一次性去重。
var pattern = @"\b(\w+)\s\1\b";
var replacement = "$+";
var input = "the the dog jumped over the fence fence.";
var result = Regex.Replace(input, pattern, replacement);
就分享这么多,如有不对的地方,欢迎大佬指正!