定义和使用:
1、 使用RegExp构造函数,在运行时新建正则表达式 var patt1 = new RegExp("Hello",“i”);
2、使用字面量,以斜杠表示开始和结束,在编译时新建正则表达式 var patt2 = /Hello/i ;
test 方法
检索字符串中的指定值,返回值是 true 或 false
var pat = /today/;
var str = "It is a beautiful day today...";
console.log(pat.test(str)); // true
exec 方法
检索字符串中的指定值,返回值是被找到的值。如果不匹配,返回 null
var pat = /hello/;
console.log(pat.exec("oh hello world")); // ["hello", index: 3, input: "oh hello world"]
如果正则表示式包含圆括号(即要求“组匹配”),则返回的数组会包括多个元素。其中,第一个元素是整个匹配成功的结果,后面的元素就是圆括号对应的匹配成功的组。也就是说,第二个元素对应第一个括号,第三个元素对应第二个括号,以此类推。整个返回数组的length
属性等于匹配成功的组数 + 1
var s = '_x_x';
var r = /_(x)/;
r.exec(s) // ["_x", "x"]
exec 方法返回数组还包含以下两个属性:
input— 整个原字符串
index — 整个模式匹配成功的开始位置(从0开始)
var r = /a(b+)a/;
var arr = r.exec("_abbba_aba_");
arr // ["abbba", "bbb"]
arr.index // 1
arr.input // "_abbba_aba_"
字符串查找 search() 按照给定的正则表达式进行搜索,返回一个整数,表示匹配开始的位置;如果没有任何匹配,则返回 -1
var str="Hello W3School!";
console.log(str.search(/w3school/)); //-1
console.log(str.search(/w3school/i)); // 6
正则表达式使用g
修饰符之后,使用lastIndex
属性指定开始匹配的位置,结果无效,还是从字符串的第一个字符开始匹配。
var r = /x/g;
r.lastIndex = 2; // 无效
'_x_x'.search(r) // 1
字符串匹配match() 返回一个数组,成员是所有匹配的子字符串
var str="8 plus 32 equal 40";
console.log(str.match(/\d+/)); // ["8", index: 0, input: "8 plus 32 equal 40"]
console.log(str.match(/\d+/g)); // ["8", "32", "40"]
如果正则表达式带有g
修饰符,则该方法与正则对象的exec
方法行为不同,会一次性返回所有匹配成功的结果。
var s = "abba";
var r = /a/g;
s.match(r) // ["a", "a"]
r.exec(s) // ["a"]
设置正则表达式的lastIndex
属性,对match
方法无效,匹配总是从字符串的第一个字符开始。
字符串替换 replace() 按照给定的正则表达式进行替换,返回替换后的字符串
var str="Hello Tom! I am sherry"
console.log(str.replace(/tom/, "Lily")); // Hello Tom! I am sherry
console.log(str.replace(/Tom/ig, "Mike")); // Hello Mike! I am sherry
字符串分割 split() 按照给定规则进行字符串分割,返回一个数组,包含分割后的各个成员
var str = "Hello Tom! I am sherry.";
str.split(""); // ["H", "e", "l", "l", "o", " ", "T", "o", "m", "!", " ", "I", " ", "a", "m", " ", "s", "h", "e", "r", "r", "y", "."]
str.split(/\s+/); // ["Hello", "Tom!", "I", "am", "sherry."]
如果正则表达式带有括号,则括号匹配的部分也会作为数组成员返回
"aaa*a*".split(/(a*)/) //["", "aaa", "*", "a", "*"]
1、修饰符
i 执行对大小写不敏感的匹配
g 执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。正则模式含有g
修饰符,每次都是从上一次匹配成功处,开始向后匹配。
//不区分大小写,全局匹配
var str="hello Hunger valley! I am hunger";
var patt1=/hunger/gi;
console.log(str.match(patt1)); // ["Hunger", "hunger"]
lastIndex : 返回下一次开始搜索的位置,该属性可读写,但只在设置了g修饰符时有意义。
source : 返回正则表达式的字符串形式(不包括反斜杠),该属性只读。
var r = /abc/ig;
r.lastIndex // 0
r.source // "abc"
2、方括号:用于查找某个范围内的任意一个字符
[abc] 查找方括号之间的任意一个字符
[^abc} 查找不在方括号之间的任意一个字符,^ (脱字符,只有在字符类的第一个位置才有特殊含义,否则就是字面含义)
如果方括号内没有其他字符,即只有[^]
,就表示匹配一切字符,其中包括换行符,而点号(.
)是不包括换行符的
var s = 'Please yes\nmake my day!';
s.match(/yes.*day/) // null
s.match(/yes[^]*day/) // ['yes\nmake my day']
[0-9] 查找任意一个从 0 到 9 的数字
[a-z] 查找任意一个从小写 a 到小写 z 的字符
[A-Z] 查找任意一个从大写 A 到大写 Z 的字符
[A-z] 查找任意一个从大写 A 到小写z 的字符
- (连字符,提供简写形式,表示字符的连续范围,要用在方括号之中,并且在头尾两个字符中间)
比如,[abc]
可以写成[a-c]
,[0123456789]
可以写成[0-9]
,同理[A-Z]
表示26个大写字母。
/a-z/.test('b') // false
/[a-z]/.test('b') // true
[-9]
就表示匹配连字符和9,而不是匹配0到9。
[1-31]
,不代表1到31,只代表1到3
[adgk] 查找给定集合内的任何字符
[^adgk] 查找给定集合外的任何字符
(red|blue|green) 查找任何指定的选项,竖线符号(|
)在正则表达式中表示“或关系”(OR)
3、元字符(Metacharacter)
. 匹配单个字符,除了换行 (\n) 、回车 (\r) 、行分隔符 (\u2028)、段分隔符 (\u2029)
\w 匹配任意一个字母或数字或下划线,即 A~Z , a~z , _ 中任意一个,相当于[A-Za-z0-9_]
\W 查找非单词字符,相当于[^A-Za-z0-9_]
\d 匹配任意一个数字,0~9中的任意一个,相当于[0-9]
\D 查找非数字字符,相当于[^0-9]
\s 匹配空格、制表符、换页符等空白字符的任意一个,相等于[\t\r\n\v\f]
\S 查找非空白字符,相当于[^\t\r\n\v\f]
\b 匹配单词边界,本身不匹配任何字符,它在匹配结果中所处位置的左右两边,一边是 "/w' 范围,一边非 "/w" 范围
\B 匹配非单词边界,即在词的内部
\0 查找NULL字符
\n 查找换行符,通常,正则表达式遇到换行符(\n
)就会停止匹配。
\f 查找换页符
\r 查找回车符
\t 查找制表符 tab
\v 查找垂直制表符
\xxx 查找以八进制数 xxx 规定的字符
\xdd 查找以十六进制数 dd 规定的字符
\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符
4、量词
n+ 匹配任何包含至少一个 n 的字符串,相当于 {1,}
n* 匹配任何包含零个或任意个 n 的字符串,相当于 {0,}
n? 匹配任何包含零个或一个 n 的字符串,相当于 {0,1}
n{X} 匹配包含 X 个 n 的序列的字符串
n{X,Y} 匹配包含 X 至 Y 个 n 的序列的字符串,例如:"at{1,3}" 可以匹配 "at" 或 "att" 或 "attt"
n{X,} 匹配包含至少 X 个 n 的序列的字符串
n$ 匹配任何结尾为 n 的字符串
^n 匹配任何开头为 n 的字符串
?=n 匹配任何其后紧接指定字符串 n 的字符串
?!n 匹配任何其后没有紧接指定字符串 n 的字符串
5、简单的转义字符(^
、.
、[
、$
、(
、)
、|
、*
、+
、?
、{
和\\
这12个字符需要用斜杠转义
)
\^ 匹配 ^ 符号本身
\$ 匹配 $ 符号本身
\. 匹配小数点本身
如果使用RegExp
方法生成正则对象,转义需要使用两个斜杠,因为字符串内部会先转义一次。
贪婪模式
+、*、? 这三个量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。
var s = 'aaa';
s.match(/a+/) // ["aaa"]
如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号
var s = 'aaa';
s.match(/a+?/) // ["a"]
模式结尾添加了一个问号/a+?/
,这时就改为非匹配模式,一旦条件满足,就不再往下匹配。
组匹配
1、使用组匹配时,不宜同时使用g
修饰符,否则match
方法不会捕获分组的内容。
var m = 'abcabc'.match(/(.)b(.)/g);
m // ["abc", "abc"]
var m = 'abcabc'.match(/(.)b(.)/);
m // ["abc", "a", "c"]
2、在正则表达式内部,可以用\n
引用括号匹配的内容,n
是从1开始的自然数,表示对应顺序的括号。
/(.)b(.)\1b\2/.test("abcabc") // true \1
表示前一个括号匹配的内容(即“a”),\2
表示第二个括号匹配的内容(即“c”)
非捕获组
(?:x)
称为非捕获组(Non-capturing group),表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。
var m = 'abc'.match(/(?:.)b(.)/);
m // ["abc", "c"]
先行断言
x(?=y)
称为先行断言(Positive look-ahead),x
只有在y
前面才匹配,y
不会被计入返回结果。
var m = 'abc'.match(/b(?=c)/);
m // ["b"]
后行断言
x(?!y)
称为后行断言(Negative look-ahead),x
只有不在y
前面才匹配,y
不会被计入返回结果。
var m = 'abd'.match(/b(?!c)/);
m // ["b"]
/\d+(?!\.)/.exec('3.14') // ["14"]
最后,分享两个不错的网站:
正则表达式调试工具 http://www1.w3cfuns.com/tools.php?mod=regex
分析工具 http://regexper.com/