【正则表达式】 语法及常用正则表达式

语法

元字符含义案例
.除了\n以外的任意一个单个字符abc123@#$等等
[]范围[a-z],小写字母中的任意一个,把正则表达式中元字符的意义干掉,原样输出[5]就是数字5
*0-多次[a-z][0-9]*,任意一个小写字母,后边跟着0个或多个,a1,a123,b1,b都匹配
+1-多次[a-z][3]+ 小写字母一个后面最少一个3,或者多个3,如c3,cc33,abcddd3333
?0-1次[2][a-z]?,数字2后边出现0或1个任意小写字母
()分组,或者提升优先级
|或者[a-z]|[0-9],任意一个小写字母或者任意一个数字
{0,}和*一样参考*
{1,}和+一样参考+
{m,n}最少m个,最多n个
\d数字中的一个123467890
\D非数字与\d相反
\s空白符包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S非空白符与\s相反
\W非字母、数字、下划线等价于 ‘[^A-Za-z0-9_]’
\w字母、数字、下划线等价于’[A-Za-z0-9_]’
\b匹配一个单词边界,单词和空格间的位置。例如, ‘er\b’ 可以匹配"never" 中的 ‘er’,但不能匹配 “verb” 中的 ‘er’。
\B匹配非单词边界。‘er\B’ 能匹配 “verb” 中的 ‘er’,但不能匹配 “never” 中的 ‘er’。
^取反,开始[^0-9],非数字,与\D一样,与\d相反,/^5/,以5开始
$结束/[9]$/,以9结束
\f换页符。等价于 \x0c 和 \cL。
\n换行符。等价于 \x0a 和 \cJ。
\r回车符。等价于 \x0d 和 \cM。
\t制表符。等价于 \x09 和 \cI。
\v垂直制表符。等价于 \x0b 和 \cK。
\将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。例如,‘n’ 匹配字符 “n”。’\n’ 匹配一个换行符。序列 ‘\’ 匹配 “” 而 “(” 则匹配 “(”。
(?:pattern)匹配 pattern 但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用 “或” 字符 (
(?=pattern)正向肯定预查(look ahead positive assert),在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,"Windows(?=95
(?!pattern)正向否定预查(negative assert),在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如"Windows(?!95
(?<=pattern)反向(look behind)肯定预查,与正向肯定预查类似,只是方向相反。例如,"(?<=95
(?<!pattern)反向否定预查,与正向否定预查类似,只是方向相反。例如"(?<!95
\cx匹配由 x 指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 ‘c’ 字符。
\xn匹配 n,其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,’\x41’ 匹配 “A”。’\x041’ 则等价于 ‘\x04’ & “1”。正则表达式中可以使用 ASCII 编码。
\num匹配 num,其中 num 是一个正整数。对所获取的匹配的引用。例如,’(.)\1’ 匹配两个连续的相同字符。
\n标识一个八进制转义值或一个向后引用。如果 \n 之前至少 n 个获取的子表达式,则 n 为向后引用。否则,如果 n 为八进制数字 (0-7),则 n 为一个八进制转义值。
\nm标识一个八进制转义值或一个向后引用。如果 \nm 之前至少有 nm 个获得子表达式,则 nm 为向后引用。如果 \nm 之前至少有 n 个获取,则 n 为一个后跟文字 m 的向后引用。如果前面的条件都不满足,若 n 和 m 均为八进制数字 (0-7),则 \nm 将匹配八进制转义值 nm。
\nml如果 n 为八进制数字 (0-3),且 m 和 l 均为八进制数字 (0-7),则匹配八进制转义值 nml。
\un匹配 n,其中 n 是一个用四个十六进制数字表示的 Unicode 字符。例如, \u00A9 匹配版权符号 (?)。

常用正则表达式

  • 匹配所有的正数:^[0-9]+$
  • 匹配所有的小数:^\-?[0-9]*\.?[0-9]*$
  • 匹配所有的整数:^\-?[0-9]+$
  • 任何数字:(-?\d*)(\.\d+)?
  • 中文字符串:[\u4e00-\u9fa5]*
  • 邮件地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(.[a-zA-Z0-9_-])+/
  • 中国手机号码:1[345678]\d{9}
  • 中国固定电话号码:(\(\d{3,4}\)|\d{3,4}-|\s)?\d{8}
  • 中国邮政编码:[1-9]{1}(\d+){5}
  • 中国身份证号码(18位):^[1-9]\d{5}(18|19|([23]\d))\d{2}((0[1-9])|(10|11|12))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$
  • 匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/

参考资料

正则表达式
正则表达式 - 元字符
一些常用的正则表达式示例
正则表达式–验证手机号
15/18位身份证号码验证的正则表达式总结(详细版)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值