js 正则详解
CSDN的markdown布局有点乱,调了很久还是有点问题,也可以点击这里查看原文
1.1 RegExp 构造函数
<font color ="red">文章有点详细,比较长,可以根据关键标题跳跃查看自己想看的内容</font>
RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。
直接量语法
/pattern/attributes
创建 RegExp 对象的语法
new RegExp(pattern, attributes);
参数
参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数(es5中)。
返回值
一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。 如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。
抛出
SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。 TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。
在ES5中,RegExp构造函数参数有两种情况
第一种情是,参数是字符串,这时第二个参数表示正则表达式的修饰符(flag)。如下面的i
var regex = new RegExp('xyz', 'i');
// 等价于
var regex = /xyz/i;
第二种情况是,参数本身就是正则表达式,如/xyz/i,这时返回的是一个原有的正则表达式的拷贝
var regex = new RegExp(/xyz/i);
// 等价于
var regex = /xyz/i;
在这种情况下,ES5不允许后面添加修饰符,如:
var regex = new RegExp(/xyz/,'i');
// 这样会报错
在ES6中可以这么写,如果RegExp第一个参数为正则表达式对象的话(有这个‘’符号的是字符串对象,看仔细点,嘿嘿),那么可以使用第二个参数指定修饰符,这个时候第二个参数会代替第一个参数的正则表达式对的修饰符,如下面所示
var regex = new RegExp(/abc/ig,'i').flags
// i
在上面代码中,原有的正则表达式的修饰符ig。会被第二个参数i代替,
总结:个人觉得正则表达式的写法直接var regex = /xyz/i;这样的写法得了(搞的那么麻烦),类似var regex = new RegExp('xyz', 'i');这种参数写法的,如果参数都为字符串,ES5,ES6写法是一样的,如果参数本身就为正则对象,ES5会报错,ES6中第二个参数的修饰符会代替原有正则的修饰符
1.2 正则表达式
###注意:正则表达式书写规则这里不讲解。理由大家懂得,不会的网上搜搜,也有很多现成的###
1.3 正则方法
1.3.1 字符串对象
字符串对象共有4个方法,可以使用正则表达式:match()、replace()、search()和split()
-
search 检索与正则表达式相匹配的指
stringObject.search(regexp)
参数 | 描述 |
---|---|
regexp | 该参数可以是需要在 stringObject 中检索的子串,也可以是需要检索的 RegExp 对象。注释:要执行忽略大小写的检索,请追加标志 i,对大小写敏感。 |
返回值 | stringObject 中第一个与 regexp 相匹配的子串的起始位置。注释:如果没有找到任何匹配的子串,则返回 -1。 |
说明 | search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。 |
例子:
var str = 'hello,this is serch demo';
aaaa = str.search(/this/);
//aaaa为:6
-
match 找到一个或多个正则表达式的匹配
stringObject.match(searchvalue) stringObject.match(regexp)
match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。 该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。
参数 | 描述 |
---|---|
searchvalue | 必须,规定要检索的字符串值 |
regexp | 必须,规定要匹配的模式的 RegExp 对象。如果该参数不是 RegExp 对象,则需要首先把它传递给 RegExp 构造函数,将其转换为 RegExp 对象。 |
返回值 | 存放匹配结果的数组。该数组的内容依赖于 regexp 是否具有全局标志 g。 |
说明
match() 方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。
如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。
如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。
注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。
例子1:
var str = '1 + 2 = 3,1+1=3';
myRegex = /\d+/;
aaaa = str.match(myRegex);
//aaaa为:[ '1', index: 0, input: '1 + 2 = 3,1+1=3' ]
例子2:
var str = '1 + 2 = 3,1+1=3';
myRegex = /\d+/g;
aaaa = str.match(myRegex);
//aaaa为:[ '1', '2', '3', '1', '1', '3' ]
-
replace 替换与正则表达式匹配的子串 stringObject.replace(regexp/substr,replacement)
replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串
参数 | 描述 |
---|---|
regexp/substr | 必需。规定子字符串或要替换的模式的 RegExp 对象。</br>请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。 |
replacement | 必需。一个字符串值。规定了替换文本或生成替换文本的函数 |
返回值 | 一个新的字符串,是用 replacement 替换了 regexp 的第一次匹配或所有匹配之后得到的。 |
说明
字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串,然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。
例子:
var str = 'wecome to chain';
myRegex = /chain/;
aaaa = str.replace(myRegex,'jiangxi');
//aaaa为:wecome to jiangxi
-
split 把字符串分割为字符串数组
stringObject.split(separator,howmany)
split() 方法用于把一个字符串分割成字符串数组。
参数 | 描述 |
---|---|
separator | 必需。字符串或正则表达式,从该参数指定的地方分割 stringObject。 |
howmany | 可选。该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度。 |
返回值
一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括 separator 自身。
但是,如果 separator 是包含子表达式的正则表达式,那么返回的数组中包括与这些子表达式匹配的字串(但不包括与整个正则表达式匹配的文本)。
例子:
"hello".split("", 3) //可返回 ["h", "e", "l"]
1.3.2 RegExp对象方法
RegExp对象方法共有3个方法compile、exec、test
-
compile 编译正则表达式
RegExpObject.compile(regexp,modifier)
compile() 方法用于在脚本执行过程中编译正则表达式。<br> compile() 方法也可用于改变和重新编译正则表达式。
参数 | 描述 |
---|---|
regexp | 正则表达式 |
modifier | 规定匹配的类型。"g" 用于全局匹配,"i" 用于区分大小写,"gi" 用于全局区分大小写的匹配。 |
实例
在字符串中全局搜索 "man",并用 "person" 替换。然后通过 compile() 方法,改变正则表达式,用 "person" 替换 "man" 或 "woman",
<script type="text/javascript">
var str="Every man in the world! Every woman on earth!";
patt=/man/g;
str2=str.replace(patt,"person");
document.write(str2+"<br />");
patt=/(wo)?man/g;
patt.compile(patt);
str2=str.replace(patt,"person");
document.write(str2);
</script>
输出
Every person in the world! Every woperson on earth!
Every person in the world! Every person on earth!
-
exec 检索字符串中指定的值,返回找到的值,并确定其位置
RegExpObject.exec(string)
exec() 方法用于检索字符串中的正则表达式的匹配。
参数 | 描述 |
---|---|
string | 必需,要检索的字符串 |
返回值 | 返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null。 |
说明
exec() 方法的功能非常强大,它是一个通用的方法,而且使用起来也比 test() 方法以及支持正则表达式的 String 对象的方法更为复杂。
如果 exec() 找到了匹配的文本,则返回一个结果数组。否则,返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本,第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本(如果有的话),第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本(如果有的话),以此类推。除了数组元素和 length 属性之外,exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出,在调用非全局的 RegExp 对象的 exec() 方法时,返回的数组与调用方法 String.match() 返回的数组是相同的。
但是,当 RegExpObject 是一个全局正则表达式时,exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说,您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时,它将返回 null,并把 lastIndex 属性重置为 0。
**例子**
var pattern = /Box/g;
var str = 'BoxssddsfBoxsboxdsf323sBox';
var match=pattern.exec(str);
var results=[];
while(match != null){
results.push(match);
console.log(match);
console.log(pattern.lastIndex);
// console.log(results);
match=pattern.exec(str);
}
输出结果
[ 'Box', index: 0, input: 'BoxssddsfBoxsboxdsf323sBox' ]
2017-06-01 22:08:59.205 [info][tid:com.facebook.react.JavaScript]3
[ 'Box', index: 9, input: 'BoxssddsfBoxsboxdsf323sBox' ]
2017-06-01 22:08:59.206 [info][tid:com.facebook.react.JavaScript] 12
[ 'Box', index: 23, input: 'BoxssddsfBoxsboxdsf323sBox' ]
2017-06-01 22:08:59.206 [info][tid:com.facebook.react.JavaScript] 26
exec方法执行一次只会返回一个结果
正则表达式lastindex属性表示下次匹配的起始位置,对应的,每次exec方法执行后,lastindex值都会变
而字符串match方法一次就返回所有的结果
exec要注意以下几点
* exec返回的是一个数组
* 该数组的属性有input(被匹配的整个字符串) index(匹配到第一个元素的开始位置)
* lastIndex还有个匹配到第一个属性后,指向的位置 这个属性智能由RegExp 对象!!!来访问通过这个属性可以来获取 所用所匹配到字符的字符串
-
test 检索字符串中指定的值。返回true或者false
RegExpObject.test(string)
test() 方法用于检测一个字符串是否匹配某个模式.
参数 | 描述 |
---|---|
string | 必需,要检测的字符串 |
返回值 | 返回bool值,如果字符串 string 中含有与 RegExpObject 匹配的文本,则返回 true,否则返回 false。 |
说明
调用 RegExp 对象 r 的 test() 方法,并为它传递字符串 s,与这个表示式是等价的:(r.exec(s) != null)。
(个人理解)这句话看起来复杂,其实很好理解,r.exec(s)调用的是exec()方法,上面讲过,如果存在则返回一个数组,数组不等于空,不就是存在的意思吗?而test()方法返回bool值,如果字符串 string 中含有与 RegExpObject 匹配的文本,则返回 true,否则返回 false。所以等价!
老规矩,来个栗子
var str = "Visit W3School";
var patt1 = new RegExp("W3School");
var result = patt1.test(str);
console.log(result);
输出
[tid:com.facebook.react.JavaScript] true
理论终于写完了,好累啊!!!
写了这么多提供点福利吧,这里提供了一个常用的js 正则封装模块,如果不够用,可以模仿添加就好了点击链接