JavaScript RegExp 对象参考手册--整理

    本文整理归纳了一些网上关于正则的资源,还有一些自己的总结归纳。

JavaScript RegExp 对象参考手册

RegExp 对象

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法:

new RegExp(pattern, attributes);

参数

参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。

返回值

一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。

如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。

抛出

SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。

TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。

修饰符

修饰符

描述

i

执行不区分大小写的匹配。

g

执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。

m

执行多行匹配。

方括号

方括号用于查找某个范围内的字符:

表达式

描述

[abc]

查找方括号之间的任何字符。

[^abc]

查找任何不在方括号之间的字符。

[0-9]

查找任何从 至 的数字。

[a-z]

查找任何从小写 到小写 的字符。

[A-Z]

查找任何从大写 到大写 的字符。

[a-Z]

查找任何从小写 到大写 的字符。

[adgk]

查找给定集合内的任何字符。

[^adgk]

查找给定集合外的任何字符。

[red|blue|green]

查找任何指定的选项。

元字符

元字符(Metacharacter)是拥有特殊含义的字符:

元字符

描述

.

查找单个字符,除了换行和行结束符。

\w

查找单词字符。

\W

查找非单词字符。

\d

查找数字。

\D

查找非数字字符。

\s

查找空白字符。

\S

查找非空白字符。

[\b]

退格直接量(特例)

\0

查找 NUL 字符。

\n

查找换行符。

\f

查找换页符。

\r

查找回车符。

\t

查找制表符。

\v

查找垂直制表符。

\xxx

查找以八进制数 xxx 规定的字符。

\xdd

查找以十六进制数 dd 规定的字符。

\uxxxx

查找以十六进制数 xxxx 规定的 Unicode 字符。

量词

量词

描述

n+

匹配任何包含至少一个 的字符串。

n*

匹配任何包含零个或多个 的字符串。

n?

匹配任何包含零个或一个 的字符串。

n{X}

匹配包含 个 的序列的字符串。

n{X,Y}

匹配包含 或 个 的序列的字符串。

n{X,}

匹配包含至少 个 的序列的字符串。

n$

匹配任何结尾为 的字符串。

^n

匹配任何开头为 的字符串。

?=n

匹配任何其后紧接指定字符串 的字符串。

?!n

匹配任何其后没有紧接指定字符串 的字符串。

选择、分组和引用字符

字符

含义

|

选择。匹配的是该符号左边的子表达式或右边的子表达式,其实就是布尔

...

组合。将几个项目组合为一个单元,这个单元可由*+?|等符号使用,而且 还可以记住和这个组合匹配的字符以供此后的引用使用

(?:…)

只分组。把项目组合到一个单元,但是不记忆与该组匹配的字符

\n

和第n个分组第一次匹配的字符相匹配。组是括号 中的子表达式(可嵌套,以左半括号开始数,从1开始数,一到数下去 ),以(?:…)分组的组不进行编码

例:匹配单引号或双引号中的0个或多个字符:/[‘”][^’”]*\1/

注:运用了分组,\1引用的第一个带圆括号的子表达式

锚字符

字符

含义

^

匹配字符串的开头,在多行检索中,匹配一行的开头

$

匹配字符串的结尾,在多行检索中,匹配一行的结尾

 

\b

匹配一个单词的边界,简言之,就是位于字符\w\W之间的位置,或位于字符\w和字符串的开头或者结尾之间的位置([\b]匹配的是退格符)

\B

匹配非单词边界的位置

(?=p)

零宽正向先行断言,要求接下来的字符都与p匹配,但不能包括匹配p的那些字符

(?=!)

零宽负向先行断言,要求接下来的字符串不与p匹配

 

例:/[Jj]ava([Ss]cript)?(?=\:)/

可匹配“javascript:a language”而不能匹配“java a language”因为java后面没有“:”。

 

其他注意事项

贪婪匹配 /a+/  ‘aaa’ 结果 ‘aaa’

  非贪婪(加?)  /a+?/  ‘aaa’  ‘a’

  特殊 /a+?b/  ‘aaab’  ‘aaab’ 正则模式匹配总是寻找字符串中第一个可能匹配的位置,这里不考虑它的子串中更短的匹配 

 

RegExp 对象属性

FF: Firefox, IE: Internet Explorer

属性

描述

FF

IE

global

只读,RegExp 对象是否具有标志 g

1

4

ignoreCase

只读,RegExp 对象是否具有标志 i

1

4

lastIndex

/写,一个整数,如果模式中有g,标示开始下一次检索的开始位置。

1

4

multiline

只读,RegExp 对象是否具有标志 m

1

4

source

只读,正则表达式的源文本。

1

4

RegExp 对象方法

FF: Firefox, IE: Internet Explorer

方法

描述

FF

IE

compile

编译正则表达式。

1

4

exec

检索字符串中指定的值。返回找到的值,并确定其位置。

1

4

test

检索字符串中指定的值。返回 true 或 false

1

4

1

var q=/java/g;

var str="java is java";

console.log(q.exec(str).index+':'+q.lastIndex);//04

console.log(q.exec(str).index+':'+q.lastIndex);//812

注:如果无‘g’修饰符,则都输出“00

支持正则表达式的 String 对象的方法

FF: Firefox, IE: Internet Explorer

方法

描述

FF

IE

search

检索与正则表达式相匹配的值。找不到返回-1。不支持全局检索(g

1

4

match

找到一个或多个正则表达式的匹配。

1

4

replace

替换与正则表达式匹配的子串。

1

4

split

把字符串分割为字符串数组。

1

4

1var q=/"([^"]*)"/;

var str="\"文本\"".replace(q,'$1');//$1可以代表q中的“([^”])”,在这里指“文本”

console.log(str);//输出“文本”

2

var q=/(\w+):\/\/([\w.]+)\/(\S*)/;

var str="visit http://www.baidu.com/abc";

console.log(str.match(q));//["http://www.baidu.com/abc", "http", "www.baidu.com", "abc"]

 

常用正则表达式大全

匹配中文字符的正则表达式: [u4e00-u9fa5]   
评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 

匹配双字节字符(包括汉字在内):[^x00-xff] 
评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 

匹配空白行的正则表达式:ns*r 
评注:可以用来删除空白行 

匹配HTML标记的正则表达式:< (S*?)[^>]*>.*?|<.*? /> 
评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂 的嵌套标记依旧无能为力 

匹配首尾空白字符的正则表达式:^s*|s*$ 
评注:可以用来删除行首行尾的空白字符(包括空格、制 表符、换页符等等),非常有用的表达式 

匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+ ([-.]w+)* 
评注:表单验证时很实用 

匹配网址URL的正则表达式:[a-zA-z]+://[^s]* 
评注:网上流传的版本功能很有限,上面这个基本可以满足需求 

匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划 线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$ 
评注:表单验证时很实用 
  

匹配国内电话号 码:d{3}-d{8}|d{4}-d{7} 
评注:匹配形式如0511-4405222或021-87888822 
  

匹 配腾讯QQ号:[1-9][0-9]{4,} 
评注:腾讯QQ号从10000开始 

匹配中国邮政编码:[1-9]d{5} (?!d) 
评注:中国邮政编码为6位数字 
  

匹配身份证:d{15}|d{18} 
评注:中国的身份证为15位或18位 

匹配ip地址:d+.d+.d+.d+ 
评注:提取ip地址时有用 

匹配特定数字: 
^[1-9]d*$    //匹配正整数 
^-[1-9]d*$   //匹配负整数 

^-?[1-9]d*$   //匹配整数 
^[1-9]d*|0$  //匹配非负整数(正整数 + 0) 
^-[1-9]d*|0$   //匹配非正整数(负整数 + 0) 
^[1-9]d*.d*|0.d*[1-9]d*$   //匹配正浮点数  ^-([1-9]d*.d*|0.d*[1-9]d*)$  //匹配负浮点数 
^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$  //匹配浮点数 
 ^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$   //匹配非负浮点数(正浮点数 + 0) ^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数 + 0) 
评注:处理大量 数据时有用,具体应用时注意修正 
  

匹配特定字符串: 
  ^[A-Za-z]+$  //匹配由26个英文字母组成的字符串 
   ^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串 
  ^[a-z]+$  //匹配由26个英文字母的小写组成的字符串 
   ^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串 
  ^w+$  //匹配由数字、26个英文字母或者下划线组 成的字符串 
  在使用RegularExpressionValidator验证控件时的验证功能及其验证表达式介绍如下: 
  只能 输入数字:“^[0-9]*$” 
  只能输入n位的数字:“^d{n}$” 
  只能输入至少n位数字:“^d{n,}$” 
   只能输入m-n位的数字:“^d{m,n}$” 
  只能输入零和非零开头的数字:“^(0|[1-9][0-9]*)$” 
  只能 输入有两位小数的正实数:“^[0-9]+(.[0-9]{2})?$” 
  只能输入有1-3位小数的正实数:“^[0-9]+(.[0-9] {1,3})?$” 
  只能输入非零的正整数:“^+?[1-9][0-9]*$” 
  只能输入非零的负整数:“^-[1-9] [0-9]*$” 
  只能输入长度为3的字符:“^.{3}$” 
  只能输入由26个英文字母组成的字符串:“^[A-Za- z]+$” 
  只能输入由26个大写英文字母组成的字符串:“^[A-Z]+$” 
  只能输入由26个小写英文字母组成的字符 串:“^[a-z]+$” 
  只能输入由数字和26个英文字母组成的字符串:“^[A-Za-z0-9]+$” 
  只能输入由数字、 26个英文字母或者下划线组成的字符串:“^w+$” 
  验证用户密码:“^[a-zA-Z]w{5,17}$”正确格式为:以字母开头,长度 在6-18之间, 
  只能包含字符、数字和下划线。 
  验证是否含有^%&”,;=?$”等字符:“[^%& “,;=?$x22]+” 
  只能输入汉字:“^[u4e00-u9fa5],{0,}$” 
  验证Email地址:“^w+ [-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$” 
  验证InternetURL:“^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$” 
  验证电话号 码:“^((d{3,4})|d{3,4}-)?d{7,8}$” 
  正确格式为:“XXXX-XXXXXXX”,“XXXX- XXXXXXXX”,“XXX-XXXXXXX”, 
  “XXX-XXXXXXXX”,“XXXXXXX”,“XXXXXXXX”。 
   验证身份证号(15位或18位数字):“^d{15}|d{}18$” 
  验证一年的12个月:“^(0?[1-9]|1[0-2])$”正 确格式为:“01”-“09”和“1”“12” 
  验证一个月的31天:“^((0?[1-9])|((1|2) [0-9])|30|31)$” 
  正确格式为:“01”“09”和“1”“31”。 
  匹配中文字符的正则表达式: [u4e00-u9fa5] 
  匹配双字节字符(包括汉字在内):[^x00-xff] 
  匹配空行的正则表达式:n[s| ]*r 
  匹配HTML标记的正则表达式:/<(.*)>.*|<(.*) />/ 
  匹配首尾空格的正则表达 式:(^s*)|(s*$) 
  匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)* 
  匹配网址URL的正则表达式:http://([w-]+.)+[w-]+(/[w- ./?%&=]*)? 

 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值