本文整理归纳了一些网上关于正则的资源,还有一些自己的总结归纳。
JavaScript RegExp 对象参考手册
RegExp 对象
RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。
直接量语法
/pattern/attributes
创建 RegExp 对象的语法:
new RegExp(pattern, attributes);
参数
参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。
返回值
一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。
如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。
抛出
SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。
TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
修饰符
修饰符 | 描述 |
执行不区分大小写的匹配。 | |
执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。 | |
m | 执行多行匹配。 |
方括号
方括号用于查找某个范围内的字符:
表达式 | 描述 |
查找方括号之间的任何字符。 | |
查找任何不在方括号之间的字符。 | |
[0-9] | 查找任何从 0 至 9 的数字。 |
[a-z] | 查找任何从小写 a 到小写 z 的字符。 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符。 |
[a-Z] | 查找任何从小写 a 到大写 Z 的字符。 |
[adgk] | 查找给定集合内的任何字符。 |
[^adgk] | 查找给定集合外的任何字符。 |
[red|blue|green] | 查找任何指定的选项。 |
元字符
元字符(Metacharacter)是拥有特殊含义的字符:
元字符 | 描述 |
查找单个字符,除了换行和行结束符。 | |
查找单词字符。 | |
查找非单词字符。 | |
查找数字。 | |
查找非数字字符。 | |
查找空白字符。 | |
查找非空白字符。 | |
[\b] | 退格直接量(特例) |
\0 | 查找 NUL 字符。 |
查找换行符。 | |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
查找以八进制数 xxx 规定的字符。 | |
查找以十六进制数 dd 规定的字符。 | |
查找以十六进制数 xxxx 规定的 Unicode 字符。 |
量词
量词 | 描述 |
匹配任何包含至少一个 n 的字符串。 | |
匹配任何包含零个或多个 n 的字符串。 | |
匹配任何包含零个或一个 n 的字符串。 | |
匹配包含 X 个 n 的序列的字符串。 | |
匹配包含 X 或 Y 个 n 的序列的字符串。 | |
匹配包含至少 X 个 n 的序列的字符串。 | |
匹配任何结尾为 n 的字符串。 | |
匹配任何开头为 n 的字符串。 | |
匹配任何其后紧接指定字符串 n 的字符串。 | |
匹配任何其后没有紧接指定字符串 n 的字符串。 |
选择、分组和引用字符
字符 | 含义 |
| | 选择。匹配的是该符号左边的子表达式或右边的子表达式,其实就是布尔“或” |
(...) | 组合。将几个项目组合为一个单元,这个单元可由*、+、?和|等符号使用,而且 还可以记住和这个组合匹配的字符以供此后的引用使用 |
(?:…) | 只分组。把项目组合到一个单元,但是不记忆与该组匹配的字符 |
\n | 和第n个分组第一次匹配的字符相匹配。组是括号 中的子表达式(可嵌套,以左半括号开始数,从1开始数,一到数下去 ),以(?:…)分组的组不进行编码 |
例:匹配单引号或双引号中的0个或多个字符:/([‘”])[^’”]*\1/
注:运用了分组,\1引用的第一个带圆括号的子表达式
锚字符
字符 | 含义 |
^ | 匹配字符串的开头,在多行检索中,匹配一行的开头 |
$ | 匹配字符串的结尾,在多行检索中,匹配一行的结尾
|
\b | 匹配一个单词的边界,简言之,就是位于字符\w和\W之间的位置,或位于字符\w和字符串的开头或者结尾之间的位置([\b]匹配的是退格符) |
\B | 匹配非单词边界的位置 |
(?=p) | 零宽正向先行断言,要求接下来的字符都与p匹配,但不能包括匹配p的那些字符 |
(?=!) | 零宽负向先行断言,要求接下来的字符串不与p匹配
|
例:/[Jj]ava([Ss]cript)?(?=\:)/
可匹配“javascript:a language”而不能匹配“java a language”因为java后面没有“:”。
其他注意事项
贪婪匹配 /a+/ ‘aaa’ 结果 ‘aaa’
非贪婪(加?) /a+?/ ‘aaa’ ‘a’
特殊 /a+?b/ ‘aaab’ ‘aaab’ 正则模式匹配总是寻找字符串中第一个可能匹配的位置,这里不考虑它的子串中更短的匹配
RegExp 对象属性
FF: Firefox, IE: Internet Explorer
属性 | 描述 | FF | IE |
只读,RegExp 对象是否具有标志 g。 | 1 | 4 | |
只读,RegExp 对象是否具有标志 i。 | 1 | 4 | |
读/写,一个整数,如果模式中有g,标示开始下一次检索的开始位置。 | 1 | 4 | |
只读,RegExp 对象是否具有标志 m。 | 1 | 4 | |
只读,正则表达式的源文本。 | 1 | 4 |
RegExp 对象方法
FF: Firefox, IE: Internet Explorer
方法 | 描述 | FF | IE |
编译正则表达式。 | 1 | 4 | |
检索字符串中指定的值。返回找到的值,并确定其位置。 | 1 | 4 | |
检索字符串中指定的值。返回 true 或 false。 | 1 | 4 |
例1:
var q=/java/g;
var str="java is java";
console.log(q.exec(str).index+':'+q.lastIndex);//0:4
console.log(q.exec(str).index+':'+q.lastIndex);//8:12
注:如果无‘g’修饰符,则都输出“0:0”
支持正则表达式的 String 对象的方法
FF: Firefox, IE: Internet Explorer
方法 | 描述 | FF | IE |
检索与正则表达式相匹配的值。找不到返回-1。不支持全局检索(g) | 1 | 4 | |
找到一个或多个正则表达式的匹配。 | 1 | 4 | |
替换与正则表达式匹配的子串。 | 1 | 4 | |
把字符串分割为字符串数组。 | 1 | 4 |
例1:var q=/"([^"]*)"/;
var str="\"文本\"".replace(q,'$1');//$1可以代表q中的“([^”])”,在这里指“文本”
console.log(str);//输出“文本”
例2:
var q=/(\w+):\/\/([\w.]+)\/(\S*)/;
var str="visit http://www.baidu.com/abc";
console.log(str.match(q));//["http://www.baidu.com/abc", "http", "www.baidu.com", "abc"]
常用正则表达式大全
匹配中文字符的正则表达式: [u4e00-u9fa5]
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了
匹配双字节字符(包括汉字在内):[^x00-xff]
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
匹配空白行的正则表达式:ns*r
评注:可以用来删除空白行
匹配HTML标记的正则表达式:< (S*?)[^>]*>.*?|<.*? />
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂 的嵌套标记依旧无能为力
匹配首尾空白字符的正则表达式:^s*|s*$
评注:可以用来删除行首行尾的空白字符(包括空格、制 表符、换页符等等),非常有用的表达式
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+ ([-.]w+)*
评注:表单验证时很实用
匹配网址URL的正则表达式:[a-zA-z]+://[^s]*
评注:网上流传的版本功能很有限,上面这个基本可以满足需求
匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划 线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注:表单验证时很实用
匹配国内电话号 码:d{3}-d{8}|d{4}-d{7}
评注:匹配形式如0511-4405222或021-87888822
匹 配腾讯QQ号:[1-9][0-9]{4,}
评注:腾讯QQ号从10000开始
匹配中国邮政编码:[1-9]d{5} (?!d)
评注:中国邮政编码为6位数字
匹配身份证:d{15}|d{18}
评注:中国的身份证为15位或18位
匹配ip地址:d+.d+.d+.d+
评注:提取ip地址时有用
匹配特定数字:
^[1-9]d*$ //匹配正整数
^-[1-9]d*$ //匹配负整数
^-?[1-9]d*$ //匹配整数
^[1-9]d*|0$ //匹配非负整数(正整数 + 0)
^-[1-9]d*|0$ //匹配非正整数(负整数 + 0)
^[1-9]d*.d*|0.d*[1-9]d*$ //匹配正浮点数 ^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$ //匹配非负浮点数(正浮点数 + 0) ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$ //匹配非正浮点数(负浮点数 + 0)
评注:处理大量 数据时有用,具体应用时注意修正
匹配特定字符串:
^[A-Za-z]+$ //匹配由26个英文字母组成的字符串
^[A-Z]+$ //匹配由26个英文字母的大写组成的字符串
^[a-z]+$ //匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ //匹配由数字和26个英文字母组成的字符串
^w+$ //匹配由数字、26个英文字母或者下划线组 成的字符串
在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:
只能 输入数字:“^[0-9]*$”
只能输入n位的数字:“^d{n}$”
只能输入至少n位数字:“^d{n,}$”
只能输入m-n位的数字:“^d{m,n}$”
只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$”
只能 输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$”
只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9] {1,3})?$”
只能输入非零的正整数:“^+?[1-9][0-9]*$”
只能输入非零的负整数:“^-[1-9] [0-9]*$”
只能输入长度为3的字符:“^.{3}$”
只能输入由26个英文字母组成的字符串:“^[A-Za- z]+$”
只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$”
只能输入由26个小写英文字母组成的字符 串:“^[a-z]+$”
只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$”
只能输入由数字、 26个英文字母或者下划线组成的字符串:“^w+$”
验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度 在6-18之间,
只能包含字符、数字和下划线。
验证是否含有^%&”,;=?$”等字符:“[^%& “,;=?$x22]+”
只能输入汉字:“^[u4e00-u9fa5],{0,}$”
验证Email地址:“^w+ [-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
验证电话号 码:“^((d{3,4})|d{3,4}-)?d{7,8}$”
正确格式为:“XXXX-XXXXXXX”,“XXXX- XXXXXXXX”,“XXX-XXXXXXX”,
“XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。
验证身份证号(15位或18位数字):“^d{15}|d{}18$”
验证一年的12个月:“^(0?[1-9]|1[0-2])$”正 确格式为:“01”-“09”和“1”“12”
验证一个月的31天:“^((0?[1-9])|((1|2) [0-9])|30|31)$”
正确格式为:“01”“09”和“1”“31”。
匹配中文字符的正则表达式: [u4e00-u9fa5]
匹配双字节字符(包括汉字在内):[^x00-xff]
匹配空行的正则表达式:n[s| ]*r
匹配HTML标记的正则表达式:/<(.*)>.*|<(.*) />/
匹配首尾空格的正则表达 式:(^s*)|(s*$)
匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?