JavaScript RegExp 对象参考手册--整理

最新推荐文章于 2024-10-09 11:19:11 发布

vtangdg

最新推荐文章于 2024-10-09 11:19:11 发布

阅读量380

点赞数

分类专栏：学习记录文章标签： RegExp javascript 正则正则表达式

本文链接：https://blog.csdn.net/u012263973/article/details/44204623

版权

学习记录专栏收录该内容

2 篇文章 0 订阅

订阅专栏

本文整理归纳了一些网上关于正则的资源，还有一些自己的总结归纳。

JavaScript RegExp 对象参考手册

RegExp 对象

RegExp 对象表示正则表达式，它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法：

new RegExp(pattern, attributes);

参数

参数 pattern 是一个字符串，指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串，包含属性 "g"、"i" 和 "m"，分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前，不支持 m 属性。如果 pattern 是正则表达式，而不是字符串，则必须省略该参数。

返回值

一个新的 RegExp 对象，具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串，那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。

如果不用 new 运算符，而将 RegExp() 作为函数调用，那么它的行为与用 new 运算符调用时一样，只是当 pattern 是正则表达式时，它只返回 pattern，而不再创建一个新的 RegExp 对象。

抛出

SyntaxError - 如果 pattern 不是合法的正则表达式，或 attributes 含有 "g"、"i" 和 "m" 之外的字符，抛出该异常。

TypeError - 如果 pattern 是 RegExp 对象，但没有省略 attributes 参数，抛出该异常。

修饰符

修饰符	描述
i	执行不区分大小写的匹配。
g	执行全局匹配（查找所有匹配而非在找到第一个匹配后停止）。
m	执行多行匹配。

方括号

方括号用于查找某个范围内的字符：

表达式	描述
[abc]	查找方括号之间的任何字符。
[^abc]	查找任何不在方括号之间的字符。
[0-9]	查找任何从 0 至 9 的数字。
[a-z]	查找任何从小写 a 到小写 z 的字符。
[A-Z]	查找任何从大写 A 到大写 Z 的字符。
[a-Z]	查找任何从小写 a 到大写 Z 的字符。
[adgk]	查找给定集合内的任何字符。
[^adgk]	查找给定集合外的任何字符。
[red\|blue\|green]	查找任何指定的选项。

元字符

元字符（Metacharacter）是拥有特殊含义的字符：

元字符	描述
.	查找单个字符，除了换行和行结束符。
\w	查找单词字符。
\W	查找非单词字符。
\d	查找数字。
\D	查找非数字字符。
\s	查找空白字符。
\S	查找非空白字符。
[\b]	退格直接量（特例）
\0	查找 NUL 字符。
\n	查找换行符。
\f	查找换页符。
\r	查找回车符。
\t	查找制表符。
\v	查找垂直制表符。
\xxx	查找以八进制数 xxx 规定的字符。
\xdd	查找以十六进制数 dd 规定的字符。
\uxxxx	查找以十六进制数 xxxx 规定的 Unicode 字符。

量词

量词	描述
n+	匹配任何包含至少一个 n 的字符串。
n*	匹配任何包含零个或多个 n 的字符串。
n?	匹配任何包含零个或一个 n 的字符串。
n{X}	匹配包含 X 个 n 的序列的字符串。
n{X,Y}	匹配包含 X 或 Y 个 n 的序列的字符串。
n{X,}	匹配包含至少 X 个 n 的序列的字符串。
n$	匹配任何结尾为 n 的字符串。
^n	匹配任何开头为 n 的字符串。
?=n	匹配任何其后紧接指定字符串 n 的字符串。
?!n	匹配任何其后没有紧接指定字符串 n 的字符串。

选择、分组和引用字符

字符	含义
\|	选择。匹配的是该符号左边的子表达式或右边的子表达式，其实就是布尔“或”
（...）	组合。将几个项目组合为一个单元，这个单元可由*、+、?和\|等符号使用，而且还可以记住和这个组合匹配的字符以供此后的引用使用
(?:…)	只分组。把项目组合到一个单元，但是不记忆与该组匹配的字符
\n	和第n个分组第一次匹配的字符相匹配。组是括号中的子表达式(可嵌套，以左半括号开始数，从1开始数，一到数下去 )，以(?:…)分组的组不进行编码

例：匹配单引号或双引号中的0个或多个字符：/（[‘”]）[^’”]*\1/

注：运用了分组，\1引用的第一个带圆括号的子表达式

锚字符

字符	含义
^	匹配字符串的开头，在多行检索中，匹配一行的开头
$	匹配字符串的结尾，在多行检索中，匹配一行的结尾
\b	匹配一个单词的边界，简言之，就是位于字符\w和\W之间的位置，或位于字符\w和字符串的开头或者结尾之间的位置（[\b]匹配的是退格符）
\B	匹配非单词边界的位置
(?=p)	零宽正向先行断言，要求接下来的字符都与p匹配，但不能包括匹配p的那些字符
(?=!)	零宽负向先行断言，要求接下来的字符串不与p匹配

例：/[Jj]ava([Ss]cript)?(?=\:)/

可匹配“javascript:a language”而不能匹配“java a language”因为java后面没有“：”。

其他注意事项

贪婪匹配 /a+/ ‘aaa’ 结果 ‘aaa’

非贪婪(加？) /a+?/ ‘aaa’ ‘a’

特殊 /a+?b/ ‘aaab’ ‘aaab’ 正则模式匹配总是寻找字符串中第一个可能匹配的位置，这里不考虑它的子串中更短的匹配

RegExp 对象属性

FF: Firefox, IE: Internet Explorer

属性	描述	FF	IE
global	只读，RegExp 对象是否具有标志 g。	1	4
ignoreCase	只读，RegExp 对象是否具有标志 i。	1	4
lastIndex	读/写，一个整数，如果模式中有g,标示开始下一次检索的开始位置。	1	4
multiline	只读，RegExp 对象是否具有标志 m。	1	4
source	只读，正则表达式的源文本。	1	4

RegExp 对象方法

FF: Firefox, IE: Internet Explorer

方法	描述	FF	IE
compile	编译正则表达式。	1	4
exec	检索字符串中指定的值。返回找到的值，并确定其位置。	1	4
test	检索字符串中指定的值。返回 true 或 false。	1	4

例1：

var q=/java/g;

var str="java is java";

console.log(q.exec(str).index+':'+q.lastIndex);//0：4

console.log(q.exec(str).index+':'+q.lastIndex);//8：12

注：如果无‘g’修饰符，则都输出“0：0”

支持正则表达式的 String 对象的方法

FF: Firefox, IE: Internet Explorer

方法	描述	FF	IE
search	检索与正则表达式相匹配的值。找不到返回-1。不支持全局检索（g）	1	4
match	找到一个或多个正则表达式的匹配。	1	4
replace	替换与正则表达式匹配的子串。	1	4
split	把字符串分割为字符串数组。	1	4

例1：var q=/"([^"]*)"/;

var str="\"文本\"".replace(q,'$1');//$1可以代表q中的“（[^”]）”,在这里指“文本”

console.log(str);//输出“文本”

例2：

var q=/(\w+):\/\/([\w.]+)\/(\S*)/;

var str="visit http://www.baidu.com/abc";

console.log(str.match(q));//["http://www.baidu.com/abc", "http", "www.baidu.com", "abc"]

常用正则表达式大全

匹配中文字符的正则表达式： [u4e00-u9fa5]
评注：匹配中文还真是个头疼的事，有了这个表达式就好办了

匹配双字节字符(包括汉字在内)：[^x00-xff]
评注：可以用来计算字符串的长度（一个双字节字符长度计2，ASCII字符计1）

匹配空白行的正则表达式：ns*r
评注：可以用来删除空白行

匹配HTML标记的正则表达式：< (S*?)[^>]*>.*?|<.*? />
评注：网上流传的版本太糟糕，上面这个也仅仅能匹配部分，对于复杂的嵌套标记依旧无能为力

匹配首尾空白字符的正则表达式：^s*|s*$
评注：可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等)，非常有用的表达式

匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+ ([-.]w+)*
评注：表单验证时很实用

匹配网址URL的正则表达式：[a-zA-z]+://[^s]*
评注：网上流传的版本功能很有限，上面这个基本可以满足需求

匹配帐号是否合法(字母开头，允许5-16字节，允许字母数字下划线)：^[a-zA-Z][a-zA-Z0-9_]{4,15}$
评注：表单验证时很实用
　　

匹配国内电话号码：d{3}-d{8}|d{4}-d{7}
评注：匹配形式如0511-4405222或021-87888822
　　

匹配腾讯QQ号：[1-9][0-9]{4,}
评注：腾讯QQ号从10000开始

匹配中国邮政编码：[1-9]d{5} (?!d)
评注：中国邮政编码为6位数字
　　

匹配身份证：d{15}|d{18}
评注：中国的身份证为15位或18位

匹配ip地址：d+.d+.d+.d+
评注：提取ip地址时有用

匹配特定数字：
^[1-9]d*$　　 //匹配正整数
^-[1-9]d*$ 　 //匹配负整数

^-?[1-9]d*$　　 //匹配整数
^[1-9]d*|0$　 //匹配非负整数（正整数 + 0）
^-[1-9]d*|0$　　 //匹配非正整数（负整数 + 0）
^[1-9]d*.d*|0.d*[1-9]d*$　　 //匹配正浮点数 ^-([1-9]d*.d*|0.d*[1-9]d*)$　 //匹配负浮点数
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$　 //匹配浮点数
^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$　　 //匹配非负浮点数（正浮点数 + 0） ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$　　//匹配非正浮点数（负浮点数 + 0）
评注：处理大量数据时有用，具体应用时注意修正
　　

匹配特定字符串：
　　^[A-Za-z]+$　　//匹配由26个英文字母组成的字符串
　　^[A-Z]+$　　//匹配由26个英文字母的大写组成的字符串
　　^[a-z]+$　　//匹配由26个英文字母的小写组成的字符串
　　^[A-Za-z0-9]+$　　//匹配由数字和26个英文字母组成的字符串
　　^w+$　　//匹配由数字、26个英文字母或者下划线组成的字符串
　　在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下:
　　只能输入数字：“^[0-9]*$”
　　只能输入n位的数字：“^d{n}$”
　　只能输入至少n位数字：“^d{n,}$”
　　只能输入m-n位的数字：“^d{m,n}$”
　　只能输入零和非零开头的数字：“^(0|[1-9][0-9]*)$”
　　只能输入有两位小数的正实数：“^[0-9]+(.[0-9]{2})?$”
　　只能输入有1-3位小数的正实数：“^[0-9]+(.[0-9] {1,3})?$”
　　只能输入非零的正整数：“^+?[1-9][0-9]*$”
　　只能输入非零的负整数：“^-[1-9] [0-9]*$”
　　只能输入长度为3的字符：“^.{3}$”
　　只能输入由26个英文字母组成的字符串：“^[A-Za- z]+$”
　　只能输入由26个大写英文字母组成的字符串：“^[A-Z]+$”
　　只能输入由26个小写英文字母组成的字符串：“^[a-z]+$”
　　只能输入由数字和26个英文字母组成的字符串：“^[A-Za-z0-9]+$”
　　只能输入由数字、 26个英文字母或者下划线组成的字符串：“^w+$”
　　验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为：以字母开头，长度在6-18之间，
　　只能包含字符、数字和下划线。
　　验证是否含有^%&”,;=?$”等字符：“[^%& “,;=?$x22]+”
　　只能输入汉字：“^[u4e00-u9fa5],{0,}$”
　　验证Email地址：“^w+ [-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$”
　　验证InternetURL：“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$”
　　验证电话号码：“^((d{3,4})|d{3,4}-)?d{7,8}$”
　　正确格式为：“XXXX-XXXXXXX”，“XXXX- XXXXXXXX”，“XXX-XXXXXXX”，
　　“XXX-XXXXXXXX”，“XXXXXXX”，“XXXXXXXX”。
　　验证身份证号（15位或18位数字）：“^d{15}|d{}18$”
　　验证一年的12个月：“^(0?[1-9]|1[0-2])$”正确格式为：“01”-“09”和“1”“12”
　　验证一个月的31天：“^((0?[1-9])|((1|2) [0-9])|30|31)$”
　　正确格式为：“01”“09”和“1”“31”。
　　匹配中文字符的正则表达式： [u4e00-u9fa5]
　　匹配双字节字符(包括汉字在内)：[^x00-xff]
　　匹配空行的正则表达式：n[s| ]*r
　　匹配HTML标记的正则表达式：/<(.*)>.*|<(.*) />/
　　匹配首尾空格的正则表达式：(^s*)|(s*$)
　　匹配Email地址的正则表达式：w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
　　匹配网址URL的正则表达式：http://([w-]+.)+[w-]+(/[w- ./?%&=]*)?