无论是编程语言还是数据库语言,很多地方都可以支持正则表达式的使用,所以自学整理了一些常用的表达语法,以备不时之需。
基础语法
任意 .
特殊\
多字符中某一个 [] [A-Za-z0-9]
非匹配 ^ [ns]a[^0-9]\.xls
换行 \n
回车 \r
数字 \d = [0-9] 非数字 \D = [^0-9]
字母和数字 \w = [a-zA-Z0-9] 非 \W = [^a-zA-Z0-9]
空白字符\s
Posix字符类
一个或多个字符 +
零个或多个 *
零个或一个 ?
重复匹配次数 {6}
重复匹配区间 {2,4}
重复匹配至少次 {3,}
防止过度(懒惰型) ? <[Bb]>.*?</[Bb]>
边界 \b
标签在字符串中最开始 ^\s<\?xml.*\?>
零个或多个空白字符 $ </[Hh][Tt][Mm][Ll]>\s*$
分行匹配模式 (?m)^\s*//.*$ 空白开头,任意结尾
子表达式 () ( ){2,}
回溯引用 []+(\w+)[]+\| 匹配同一个单词连续两次重复出现(重复子表达式里面的内容)
匹配 <H1> 到 <H6> <[hH]([1-6])>.*?</[hH]\|>
向前查找 .+(:) http: 不消费 .+(?=:) http
向后查找 \$[0-9.]+ $23.45 不消费 (?<=\$)[0-9.]+ 23.45
非 ! (?<=\$)\d+ $30 \b(?<?\$)\d+ 100 $30
常用实例
数字:^[0-9]*$
n位的数字:^\d{n}$
至少n位的数字:^\d{n,}$
m-n位的数字:^\d{m,n}$
汉字:^[\u4e00-\u9fa5]{0,}$
英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
长度为3-20的所有字符:^.{3,20}$
Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?
InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|4|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
身份证号(15位、18位数字),最后一位是校验位,可能为数字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在 8-10 之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
强密码(必须包含大小写字母和数字的组合,可以使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
日期格式:^\d{4}-\d{1,2}-\d{1,2}