正则表达式
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
普通字符
普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。
非打印字符
非打印字符也可以是正则表达式的组成部分。下表列出了表示非打印字符的转义序列:
特殊字符
所谓特殊字符,就是一些有特殊含义的字符,简单的说就是表示任何字符串的意思。许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字符,必须首先使字符"转义",即,将反斜杠字符\ 放在它们前面。下表列出了正则表达式中的特殊字符:
限定符
限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。
正则表达式的限定符有:
元字符
一些常用的元字符
一些常用的正则表达式
作用 | 正则表达式 |
---|---|
qq号 | [1-9][0-9]{4,} |
中文字符 | [\u4e00-\u9fa5] |
中国邮政编码 | [1-9]\d{5}(?!\d) |
帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线) | 1[a-zA-Z0-9_]{4,15}$ |
密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线) | 2\w{5,17}$ |
18位身份证号码 | ^((\d{18}) |