正则表达式笔记

 

  • 正则表达式就是记录文本规则的代码


  • 精确地查找hi这个单词,使用\bhi\b


  • \b是正则表达式规定的一个特殊代码,代表着单词的开头或结尾,也就是单词的分界处。通常英文的单词是由空格,标点符号或者换行来分隔的,但是\b并不匹配这些单词分隔字符中的任何一个,它只匹配一个位置


  • 假如你要找的是hi后面不远处跟着一个Lucy,你应该用\bhi\b.*\bLucy\b


  • .是另一个元字符,匹配除了换行符以外的任意字符*同样是元字符,不过它代表的不是字符,也不是位置,而是数量——它指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配。因此,.*连在一起就意味着任意数量的不包含换行的字符。现在\bhi\b.*\bLucy\b的意思就很明显了:先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词


  • 电话号码:0\d\d-\d\d\d\d\d\d\d\d,\d是个元字符,匹配一位数字(0,或1,或2,或……)。我们也可以这样写这个表达式:0\d{2}-\d{8}。 这里\d后面的{2}({8})的意思是前面\d必须连续重复匹配2次(8次)

 

  • \s匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等\w匹配字母或数字或下划线或汉字

 

  • \ba\w*\b匹配以字母a开头的单词——先是某个单词开始处(\b),然后是字母a,然后是任意数量的字母或数字(\w*),最后是单词结束处(\b)

\d+匹配1个或更多连续的数字。这里的+是和*类似的元字符,不同的是*匹配重复任意次(可能是0次),而+则匹 配重复1次或更多次

 

\b\w{6}\b 匹配刚好6个字符的单词



 

  • 元字符^(和数字6在同一个键位上的符号)和$都匹配一个位置,这和\b有点类似。^匹配你要用来查找的字符串的开头,$匹配结尾

 

  • QQ号必须为5位到12位数字时,可以使用:^\d{5,12}${5,12}则是重复的次数不能少于5次,不能多于12次,否则都不匹配。

 

  • deerchao\.net匹配deerchao.netC:\\Windows匹配C:\Windows,使用\查找元字符本身

 

  • *重复零次或更多次,+重复一次或更多次,?重复零次或一次,{n}重复n次,{n,}重复n次或更多次,{n,m}重复n到m次

 

  • \(?0\d{2}[) -]?\d{8}  “(”和“)”也是元字符,后面的分组节里会提到,所以在这里需要使用转义。这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们对它进行一些分析吧:首先是一个转义字符\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\d{2}),然后是)-空格中的一个,它出现1次或不出现(?),最后是8个数字(\d{8})

 

  • 0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)

 

  • \(0\d{2}\)[- ]?\d{8}|0\d{2}[- ]?\d{8}这个表达式匹配3位区号的电话号码,其中区号可以用小括号括起来,也可以不用,区号与本地号间可以用连字号或空格间隔,也可以没有间隔

 

  • 描述一个正确的IP地址:((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?) ----2[0-4]\d表示2--的地址,5[0-5]表示25-的地址,[01]?\d\d?表示1位或2位或者1--的地址

 

  • \W匹配任意不是字母,数字,下划线,汉字的字符,\S匹配任意不是空白符的字符,\D匹配任意非数字的字符,\B配不是单词开头或结束的位置,[^x]匹配除了x以外的任意字符,[^aeiou]匹配除了aeiou这几个字母以外的任意字符

 

  • 小括号的另一种用途是通过语法(?#comment)来包含注释。例如:2[0-4]\d(?#200-249)|25[0-5](?#250-255)|[01]?\d\d?(?#0-199)


  • 平衡组的一个最常见的应用就是匹配HTML,下面这个例子可以匹配嵌套的<div>标签<div[^>]*>[^<>]*(((?'Open'<div[^>]*>)[^<>]*)+((?'-Open'</div>)[^<>]*)+)*(?(Open)(?!))</div>
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值