C#正则表达式

假设我们要判断一个字符串中是否只含有数字,我们怎么办?我们最想到的应该是下面的一段代码:

            string str = "what a nice day!";
            bool flag = true;
            for (int i = 0; i < str.Length; i++) {
                if (str[i] >= 0 && str[i] <= 9)
                {
                }
                else {
                    flag = false;
                    break;
                }
            }
            Console.WriteLine(flag);

好在C#为我们提供了索引器这一工具,让我们可以像访问数组的方式来访问字符串。但是上面的方法未免有点麻烦,活着说有一些局限性,如果我们要验证一个字符串是否是Email格式的呢?再通过比较字符的方法,可能就有很大的难度。那么我们来通过正则表达式的方法来改写上面的代码:

            string str = "what a nice day!";
            Console.WriteLine(Regex.IsMatch(str, "^\\d*$"));

这样我们就可以验证我们的字符串是否是纯数字构成的了。


上面的例子只是为了展示正则表达式的强大。只用几个字符就解决了字符串验证的问题。下面就来介绍正则表达式:

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
1. 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分。
正则表达式的特点是:
1. 灵活性、逻辑性和功能性非常的强;
2. 可以迅速地用极简单的方式达到字符串的复杂控制。
3. 对于刚接触的人来说,比较晦涩难懂。
—–by baidu

由一些普通字符和一些元字符组成。普通字符包括大小写的字母和数字,而元字符则具有特殊的含义。元字符这里不做一一列举,大家可以自行搜索。下面就对常用的元字符进行分类,一一介绍。

C#中的正则表达式

C#中使用正则表达式时,我们需要调用System.Text.RegularExpressions中的Regex类中的而一些方法。这个类为我们封装了一些常用的操作,如IsMatch,Replace等等,以及他们的重载。

定位元字符^,$

比如我们在一些网站上注册的时候,会要求用户名规则,比如说必须是字母开头,那么他们是如何检测的呢?看代码:

            string str = Console.ReadLine(); ;
            string pattern = "^[A-z]";//表示首字符必须是字母

            Console.WriteLine(Regex.IsMatch(str, pattern));

上面的IsMatch返回一个bool类型,如果str与pattern中的字符串要求匹配,返回True,否则False。来看正则表达式pattern。[A-z]表示匹配范围,由于在ascii表中A要比z小,所以是A-z。^这个元字符就表示匹配首位字符。与之对应的就是$,表示匹配末位字符,如果我们需要末位字符是字母,只需要把pattern改成

         string pattern = "[A-z]$";

基本元字符

我们来看一下正则表达式中的一些常用的基本元字符

  • . :匹配除换行符以外的任意字符
  • \w : 匹配字母,数字,下划线,汉字
  • \W: \w的补集
  • \s: 匹配任意空白符(空格,换行符,制表符等等)
  • \S: \s的补集
  • \d: 匹配数字(0-9)
  • \D : \d的补集
  • *: 匹配前面的子表达式任意次
    现在我们要检测一个字符串中是否有出数字以外的字符,代码如下:

            string str = Console.ReadLine(); ;
            string pattern = @"^\d*$";

            Console.WriteLine(Regex.IsMatch(str, pattern));

看pattern字符串:\d表示匹配数字,表示匹配数字任意次,^和 的话,那么字符串中有没有数字返回值都是True,因为表示匹配任意次,包括0次。

反义字符

我们上面列的\W,\S和\D就是反义字符,另外还有一些别的反义字符的写法,如:[^x]表示匹配除了x以外的字符。例如我们把除了字母以外的字符全部替换成a,我们可以这样写:

            string str = Console.ReadLine(); ;
            string pattern = @"[^A-z]";

            Console.WriteLine(Regex.Replace(str, pattern,"a"));

这样我们输入123,那么久会输出aaa。

重复匹配字符

重复匹配字符就是表示匹配前面的字符n次。如{n}表示匹配前面的字符n次,{n,}表示匹配前面的字符至少n次。{n,m}表示匹配前面的字符n到m次。比如我们要检验QQ号是否合法,代码如下:

            string str = Console.ReadLine(); ;
            string pattern = @"^\d{5,10}$";

            Console.WriteLine(Regex.IsMatch(str, pattern));

QQ号一般是5到10位的数字,所以我们匹配数字5到10次,由于我们限定了首位和末位,所以如果字符数大于10或者小于5也会返回False。

择一匹配字符

择一匹配字符只有一个|,类似于或运算,符合我们给出匹配条件中的一个就行了。例如我们过滤字符串中所有的数字和字母,可以这样:

            string str = Console.ReadLine(); ;
            string pattern = @"\d|[A-z]";
            MatchCollection result= Regex.Matches(str, pattern);//返回结果到一个集合中
            foreach (Match res in result) {
                Console.WriteLine(res.ToString());//输出过滤出的对象
            }
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值