正则表达式

正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。
元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。

基础正则表达式:

次数匹配

  • 表示前面的字符连续出现任意次,包括0次。
    . 表示任意单个字符。
    .* 表示任意长度的任意字符,与通配符中的*的意思相同。
    ? 表示匹配其前面的字符0或1次
    + 表示匹配其前面的字符至少1次,或者连续多次,连续次数上不封顶。
    {n} 表示前面的字符连续出现n次,将会被匹配到。
    {x,y} 表示之前的字符至少连续出现x次,最多连续出现y次,都能被匹配到,换句话说,只要之前的字符连续出现的次数在x与y之间,即可被匹配到。
    {,n} 表示之前的字符连续出现至多n次,最少0次,都会陪匹配到。
    {n,} 表示之前的字符连续出现至少n次,才会被匹配到.

位置匹配
^行首
KaTeX parse error: Expected group after '^' at position 4: 行尾 ^̲匹配空行
<或\b锚定词首,后面的字符需要为单词首部出现
>或\b锚定词尾,前面的单词需要为单词尾部出现
\B为\b取反

字符匹配
. 表示匹配任意单个字符

  • 表示匹配前面的字符任意次,包括0次
    [ ] 表示匹配指定范围内的任意单个字符
    [^ ] 表示匹配指定范围外的任意单个字符

[[:alpha:]] 表示任意大小写字母
[[:lower:]] 表示任意小写字母
[[:upper:]] 表示任意大写字母
[[:digit:]] 表示0到9之间的任意单个数字(包括0和9)
[[:alnum:]] 表示任意数字或字母
[[:space:]] 表示任意空白字符,包括"空格"、"tab键"等。
[[:punct:]] 表示任意标点符号

[0-9]与[[:digit:]]等效
[a-z]与[[:lower:]]等效
[A-Z]与[[:upper:]]等效
[a-zA-Z]与[[:alpha:]]等效
[a-zA-Z0-9]与[[:alnum:]]等效

[0-9]与[[:digit:]]等效
[a-z]与[[:lower:]]等效
[A-Z]与[[:upper:]]等效
[a-zA-Z]与[[:alpha:]]等效
[a-zA-Z0-9]与[[:alnum:]]等效

#简短格式并非所有正则表达式解析器都可以识别
\d 表示任意单个0到9的数字
\D 表示任意单个非数字字符
\t 表示匹配单个横向制表符(相当于一个tab键)
\s表示匹配单个空白字符,包括"空格","tab制表符"等
\S表示匹配单个非空白字符

分组与后向引用
使用后向引用的前提是将需要引用的部分分组。
( ) 表示分组,我们可以将其中的内容当做一个整体,分组可以嵌套。
(ab) 表示将ab当做一个整体去处理。
\1 表示引用整个表达式中第1个分组中的正则匹配到的结果。
\2 表示引用整个表达式中第2个分组中的正则匹配到的结果。

拓展正则:
主要区别:{} () ? + 这类都不需要再添加转义符了

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值