JavaScript-正则表达式语法规则
一、正则表达式初识
1.什么是正则表达式
正则表达式是由一个字符序列形成的搜索模式,搜索模式可用于文本搜索和文本替换。
2.创建正则表达式
JS正则表达式的创建有两种方式:
new RegExp()
和 直接字面量。
1.构造函数new RegExp()创建一个正则对象
var reg=new Regex(‘js’,’gi’)
//第一个参数是正则表达式文本,第二个参数是正则表达式修饰符。
示例
var result = new RegExp("abc")
//RegExp 是JS中的类,同Array类似
//最简单的正则表达式,将匹配字母abc
console.log(result);
console.log([result])
var result2 = new RegExp("abc","i")
重载的构造函数,其第二个参数指定将不区分大小写
console.log(result2);
console.log([result2])
运行结果:
其中,对于第二个参数,为可选参数,包括三种:
g
:全文查找,如果不添加此参数,搜索到第一个匹配就会停止;i
: ignore case 不区分大小写,默认是区分大小写的;m
:多行查找,multiple lines 默认只搜索第一行;
2.字面量的方式创建正则对象(更常见)
var reg=/js/gi;
//开始和结束的斜线/是正则表达式的边界,//中间的文本是正则表达式文本,后面的gi是正则表达式的修饰符。
示例
var reg = /hello/i;
var str = "helloword";
console.log([reg])
var result = str.match(reg);
运行结果:
3.正则表达式本身的方法
RegExp 对象有 3 个方法:test()、exec() 以及 compile()。
test()
方法用于检测一个字符串是否匹配某个模式,如果字符串中含有匹配的文本,则返回true
,否则返回false
示例
var reg = /hello/i;
var str = "helloword";
console.log(reg.test(str));
运行结果:true
exec()
用于检索字符串中的正则表达式的匹配。该函数返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null
示例
var reg = /hello/i;
var str = "helloword";
console.log( reg.exec(str));
运行结果:
补充
var reg=/js/gi;
var result=reg.exec('I like JS');//结果:JS
var result=reg.test('I like js');//结果:true
/*
特别注意,上面的test()和exec()方法执行第一次结果正确的,第二次是错误的,第三次又是正确的。
如果表达式在使用 “g” 参数时,查找工作原理如下:
找到第一个 “JS”,并存储其位置,即给RegExp对象lastIndex属性赋值
如果再次运行,则从存储的位置(lastIndex属性 )开始检索,发现后面已经找不到,然后又重头开始查找,并找到下一个 “JS”,并存储其位置
简单的说JS正则表达式在全文搜索模式会使用一个类似取队列中元素的执行过程,最后一次执行结果肯定是不正确,为避免这个隐藏的坑,建议大家使用test()和exec()方法时不要加g修饰符。
*/
compile()
方法用于改变 RegExp,既可以改变检索模式,也可以添加或删除第二个参数。
比较常用的就是正则表达式的test方法了,因为我们大多只需要知道:某个字符串是否匹配某正则表达式,是则True,否则为False。
4.修饰符
修饰符 | 描述 |
---|---|
i | ignore case 不区分大小写,默认是区分大小写的; |
g | 全文查找,如果不添加此参数,搜索到第一个匹配就会停 |
m | 多行查找,multiple lines 默认只搜索第一行; |
5.方括号
方括号用于查找某个范围内的字符
表达式 | 描述 |
---|---|
[abc] | 查找方括号之间的任何字符 |
[^abc] | 查找任何不在方括号之间的字符。 |
[0-9] | 查找任何从0至9的数字。 |
[a-z] | 查找任何从小写a到小写z的字符。 |
[A-Z] | 查找任何从大写A到大写Z的字符。 |
[A-z] | 查找任何从大写A到小写z的字符。 |
[adgk] | 查找给定集合内的任何字符。 |
[adgk] | 查找给定集合外的任何字符。 |
(red | blue|green) | 查找任何指定的选项。 |
1.示例
var reg = /[ash]ello/i;
var str = "helloword";
console.log( reg.exec(str));
运行结果:
var reg = /[as]ello/i;
var str = "helloword";
console.log( reg.exec(str));
运行结果:null
2.示例
var result = new RegExp("[^as]ello","i");
console.log(result.test("hello"));
运行结果:true
var result = new RegExp("^[^as]ello","i");
//在外面代表开头
console.log(result.test("hello"));
运行结果:true
3.示例
var reg = /hello[0-9]/i;
var str = "hello9wordhelloy";
console.log( reg.exec(str));
运行结果:Array [ “hello9” ]
4.示例
var reg = /red |blue|green/i;
console.log(reg.test("blue"));
运行结果:true
5.示例
var reg = /[0-9][0-9][0-9]/g; //三个范围取满足条件的数字
var str = "121323dvfvf ";
console.log( str.match(reg));
//结果121,323
var reg = /[ab][cd][d]/g;
var str = "abcd";
console.log( str.match(reg));
//结果bcd
var reg =/(abc|bcd)[0-9]/g
var str = "bcd2";
console.log( str.match(reg));
//结果cd2
6.元字符
正则表达式文本部分包含原义文本字符和元字符,其中的原义文本字符代表字符本身意义的字符,如abc123之类的字符。元字符代表有特殊含义非字母字符,如\b、\w、\d、+、*、? 等。
常用的元字符
元字符 | 描述 |
---|---|
. | 匹配任何字符除了换行和行结束符。[^\r\n] |
\w | 查找单词字符。[0-9A-z_] |
\W | 查找非单词字符。[^\w] |
\d | 查找数字。[0-9] |
\D | 查找非数字字符。[^\d] |
\s | 查找空白字符。[\t\n\r\v\f ] 元字符用于查找空白字符 空白格,制表符\t , 回车符\r, 换页符\f, 垂直制表符\v ,在正则表达式中的空格是真的空格 |
\S | 查找非空白字符。[^\s] |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
* | 限定符前的子模式必须出现0或多次。 |
$ | 字符串需以模式结束。 |
^ | 字符串需以模式起始。 |
| | 让模式指定一连串可供选择的子模式。 |
+ | 限定符前的子模式必须出现1或多次。 |
? | 限定符前的子模式必须出现0或1次。 |
\0 | 查找NUL字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数xxx规定的字符。 |
\dd | 查找以十六进制数dd规定的字符。 |
//\b === 单词边界
//\B === 非单词边界
//. === [^\r\n];
//$以..结尾
示例
var reg = /\wcd2/g;
var str = "bcd2";
console.log( str.match(reg));
//结果bcd2
var reg = /\d\d\d/g;
var str = "123";
console.log( str.match(reg));
//结果 123
var reg = /[\w\d]/g;
var str ="s";
console.log( str.match(reg));
//结果 s
var reg = /\bc/g;//c有左边界
var str = "abc cde fgh";
console.log( str.match(reg));
//结果 cde
var reg = /\bcde\B/g;
var str = "abc cdefgh";
console.log( str.match(reg));
//结果cde
var reg = /\tc/g;
var str = "abc cdfgh"; //不能匹配出手动空格
console.log( str.match(reg));
//结果 null
var reg = /\tc/g;
var str = "abc\tcdfgh";
console.log( str.match(reg));
//结果 \tc
7量词
量词 | 描述 |
---|---|
n+ | 匹配任何包含至少一个n的字符串。 |
n* | 匹配任何包含零个或多个n的字符串。 |
n? | 匹配任何包含零个或一个n的字符串。 |
n{X} | 匹配包含X个n的序列的字符串。 |
n{X,Y} | 匹配包含X至Y个n的序列的字符串。 |
n{X,} | 匹配包含至少X个n的序列的字符串。 |
n$ | 匹配任何结尾为n的字符串。 |
^n | 匹配任何开头为n的字符串。 |
?=n | 匹配任何其后紧接指定字符串n的字符串。 |
?!=n | 匹配任何其后没有紧接指定字符串n的字符串。 |
贪婪模式和非贪婪模式
/*
JS正则表达式默认是贪婪模式匹配,它会以最多匹配原则进行查找,非贪婪模式可以让表达式以最少匹配原则进行查找。
非贪婪模式只需要在量词后面加上”?”
即可,如”123456789″字符串想以3个数字
为一组进行匹配表达式写法/\d{3,5}?/g。*/
//n+ {1,} 1-正无穷
//n* {0,}0-正无穷
//n? {0,1}
//n{X} {x}
示例
var reg = /\w+/g;//贪婪匹配原则
var str = "abc";
console.log( str.match(reg));
//结果abc
var reg = /\d*/g;
var str = "abc";
console.log( str.match(reg));
//结果["","","",""]//能匹配多就不匹配少
var reg = /\w{3}/g;
var str = "aaaaaaaaa";
console.log( str.match(reg));
//结果["aaa","aaa","aaa"]//能匹配多就不匹配少
var reg = /\w{3,5}/g;
var str = "aaaaaaa";
console.log( str.match(reg));
//aaaaa
var reg = /\w{1,}/g;
var str = "aaaaaaaaa";
console.log( str.match(reg));
//结果["aaaaaaaaa"]//能匹配多就不匹配少
var reg = /abcd$/g;
var str = "abcded";
console.log( str.match(reg));
//结果null
var reg = /ed$/g;
var str = "abcded";
console.log( str.match(reg));
//结果ed
var reg = /^abc$/g;
var str = "abcabc";//一个开头一个结尾,限定了范围
console.log( str.match(reg));
//结果null
var reg = /^\d|\d$/gi
var str = "1abc9";
console.log( str.match(reg));
//结果:Array [ "1", "9" ]
8. ()、[]、{} 的区别
[]
是定义匹配的字符范围。[0-9]表示查找任何从 0 至 9 的数字。
{}
一般用来表示匹配的长度。{8}表示位数为8位。
()
的作用是提取匹配的字符串。表达式中有几个()
就会得到几个相应的匹配字符串。比如(\s+)
表示连续空格的字符串。
表达式中也用()
来定义一个分组,使元字符可以作用于一个表达式字符串组合,如/(js|php){3}/gi
。
表达式中的每一个分组匹配的内容都是一个可以捕获的变量,可以使用$1、$2、$3…
来取值,如表达式/(\d{4})-(\d{2})-(\d{2})/
中包含$1、$2、$3
。如果想忽略分组匹配的内容,需要在分组前面增加“?:
”,就可以得到分组匹配之外的内容。
var str = "aaaa";
var reg = /(\w)\1\1\1/g //\1引用第一个子表达式的内容
console.log( str.match(reg));
//结果 aaaa
var str = "aabb"
var reg = /(\w)\1(\w)\2/g
console.log( str.match(reg));
//结果aabb
var str = "aabb"
var reg = /(\w)\1(\w)\2/;//不加g
console.log( str.match(reg));
//结果Array(3) [ "aabb", "a", "b" ]
var str = "aabb"
var reg = /(\w)\1(\w)\2/g;
console.log( str.match(reg));
//结果Array [ "aabb" ]
var str = "edbaabbbbee"
var reg =/(\w)\1(\w)\2/g;
console.log(str.match(reg));
结果Array [ "aabb", "bbee" ]
9.支持正则表达式的String对象的方法
方法 | 描述 |
---|---|
search | 检索与正则表达式相匹配的值。 |
match | 找到一个或多个正则表达式的匹配。 |
replace | 替换与正则表达式匹配的子串。 |
split | 把字符串分割为字符串数组。 |
search()
方法,检索与正则表达式相匹配的子字符串,并返回子串的起始位置
var str = "edbaabbbbee"
var reg =/(\w)\1(\w)\2/g;
console.log(str.search(reg));
结果3 //返回匹配到的位置,匹配不到返回-1
replace()
替换与正则表达式匹配的子串。
var str = "abcdedfa";
console.log(str.replace("a","b"));
//只能选择一个匹配没有全局的能力
//结果 bbcdedfa
//如果是正则表达式
var str = "abcdedfa";
var reg = /a/;
console.log(str.replace(reg,"b"));
//结果 bbcdedfa
var str = "abcdedfa";
var reg = /a/g;
console.log(str.replace(reg,"b"));
//结果 bbadedfb
var reg =/(\w)\1(\w)\2/g;
var str = "aabb";
console.log(str.replace(reg,"$2$2$1$1"));
//结果bbaa
var reg =/(\w)\1(\w)\2/g;
var str = "aabb";
console.log(str.replace(reg,function($,$1,$2){ //第一个代表全局 第二个代表局部第一个
return $2 + $2 +$1 +$1
}));
//结果bbaa