JavaScript 正则详解

js 正则详解

CSDN的markdown布局有点乱,调了很久还是有点问题,也可以点击这里查看原文

1.1 RegExp 构造函数

<font color ="red">文章有点详细,比较长,可以根据关键标题跳跃查看自己想看的内容</font>

RegExp 对象表示正则表达式,它是对字符串执行模式匹配的强大工具。

直接量语法

/pattern/attributes

创建 RegExp 对象的语法

new RegExp(pattern, attributes);

参数

参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。

参数 attributes 是一个可选的字符串,包含属性 "g"、"i" 和 "m",分别用于指定全局匹配、区分大小写的匹配和多行匹配。ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数(es5中)。

返回值

一个新的 RegExp 对象,具有指定的模式和标志。如果参数 pattern 是正则表达式而不是字符串,那么 RegExp() 构造函数将用与指定的 RegExp 相同的模式和标志创建一个新的 RegExp 对象。 如果不用 new 运算符,而将 RegExp() 作为函数调用,那么它的行为与用 new 运算符调用时一样,只是当 pattern 是正则表达式时,它只返回 pattern,而不再创建一个新的 RegExp 对象。

抛出

SyntaxError - 如果 pattern 不是合法的正则表达式,或 attributes 含有 "g"、"i" 和 "m" 之外的字符,抛出该异常。 TypeError - 如果 pattern 是 RegExp 对象,但没有省略 attributes 参数,抛出该异常。


在ES5中,RegExp构造函数参数有两种情况

第一种情是,参数是字符串,这时第二个参数表示正则表达式的修饰符(flag)。如下面的i

var regex = new RegExp('xyz', 'i'); 
// 等价于
var regex = /xyz/i;

第二种情况是,参数本身就是正则表达式,如/xyz/i,这时返回的是一个原有的正则表达式的拷贝

var regex = new RegExp(/xyz/i);
// 等价于
var regex = /xyz/i;

在这种情况下,ES5不允许后面添加修饰符,如:

var regex = new RegExp(/xyz/,'i');
// 这样会报错

在ES6中可以这么写,如果RegExp第一个参数为正则表达式对象的话(有这个‘’符号的是字符串对象,看仔细点,嘿嘿),那么可以使用第二个参数指定修饰符,这个时候第二个参数会代替第一个参数的正则表达式对的修饰符,如下面所示

var regex = new RegExp(/abc/ig,'i').flags
// i

在上面代码中,原有的正则表达式的修饰符ig。会被第二个参数i代替,

总结:个人觉得正则表达式的写法直接var regex = /xyz/i;这样的写法得了(搞的那么麻烦),类似var regex = new RegExp('xyz', 'i');这种参数写法的,如果参数都为字符串,ES5,ES6写法是一样的,如果参数本身就为正则对象,ES5会报错,ES6中第二个参数的修饰符会代替原有正则的修饰符

1.2 正则表达式

###注意:正则表达式书写规则这里不讲解。理由大家懂得,不会的网上搜搜,也有很多现成的###

1.3 正则方法

1.3.1 字符串对象

字符串对象共有4个方法,可以使用正则表达式:match()、replace()、search()和split()

  • search 检索与正则表达式相匹配的指

      stringObject.search(regexp)
    
参数描述
regexp该参数可以是需要在 stringObject 中检索的子串,也可以是需要检索的 RegExp 对象。注释:要执行忽略大小写的检索,请追加标志 i,对大小写敏感
返回值stringObject 中第一个与 regexp 相匹配的子串的起始位置。注释:如果没有找到任何匹配的子串,则返回 -1。
说明search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。
例子:

	var str = 'hello,this is serch demo';
	aaaa = str.search(/this/);
	
	//aaaa为:6
  • match 找到一个或多个正则表达式的匹配

      stringObject.match(searchvalue)
      stringObject.match(regexp)
    

    match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。 该方法类似 indexOf() 和 lastIndexOf(),但是它返回指定的值,而不是字符串的位置。

参数描述
searchvalue必须,规定要检索的字符串值
regexp必须,规定要匹配的模式的 RegExp 对象。如果该参数不是 RegExp 对象,则需要首先把它传递给 RegExp 构造函数,将其转换为 RegExp 对象。
返回值存放匹配结果的数组。该数组的内容依赖于 regexp 是否具有全局标志 g。

说明

match() 方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。

如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。

注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。

	例子1:	
	var str = '1 + 2 = 3,1+1=3';
	myRegex = /\d+/;
	aaaa = str.match(myRegex);
	
	//aaaa为:[ '1', index: 0, input: '1 + 2 = 3,1+1=3' ]
	
	例子2:
	var str = '1 + 2 = 3,1+1=3';
	myRegex = /\d+/g;
	aaaa = str.match(myRegex);
	
	//aaaa为:[ '1', '2', '3', '1', '1', '3' ]
  • replace 替换与正则表达式匹配的子串 stringObject.replace(regexp/substr,replacement)

    replace() 方法用于在字符串中用一些字符替换另一些字符,或替换一个与正则表达式匹配的子串

参数描述
regexp/substr必需。规定子字符串或要替换的模式的 RegExp 对象。</br>请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。
replacement必需。一个字符串值。规定了替换文本或生成替换文本的函数
返回值一个新的字符串,是用 replacement 替换了 regexp 的第一次匹配或所有匹配之后得到的。

说明

字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串,然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。

例子:

	var str = 'wecome to chain';
	myRegex = /chain/;
	aaaa = str.replace(myRegex,'jiangxi');
	
	//aaaa为:wecome to jiangxi	
  • split 把字符串分割为字符串数组

      stringObject.split(separator,howmany)
    

    split() 方法用于把一个字符串分割成字符串数组。

参数描述
separator必需。字符串或正则表达式,从该参数指定的地方分割 stringObject。
howmany可选。该参数可指定返回的数组的最大长度。如果设置了该参数,返回的子串不会多于这个参数指定的数组。如果没有设置该参数,整个字符串都会被分割,不考虑它的长度。

返回值

一个字符串数组。该数组是通过在 separator 指定的边界处将字符串 stringObject 分割成子串创建的。返回的数组中的字串不包括 separator 自身。

但是,如果 separator 是包含子表达式的正则表达式,那么返回的数组中包括与这些子表达式匹配的字串(但不包括与整个正则表达式匹配的文本)。

例子:

	"hello".split("", 3)	//可返回 ["h", "e", "l"]

1.3.2 RegExp对象方法

RegExp对象方法共有3个方法compile、exec、test

  • compile 编译正则表达式

      RegExpObject.compile(regexp,modifier)
    

    compile() 方法用于在脚本执行过程中编译正则表达式。<br> compile() 方法也可用于改变和重新编译正则表达式。

参数描述
regexp正则表达式
modifier规定匹配的类型。"g" 用于全局匹配,"i" 用于区分大小写,"gi" 用于全局区分大小写的匹配。

实例

在字符串中全局搜索 "man",并用 "person" 替换。然后通过 compile() 方法,改变正则表达式,用 "person" 替换 "man" 或 "woman",

	<script type="text/javascript">
		var str="Every man in the world! Every woman on earth!";
	
		patt=/man/g;
		str2=str.replace(patt,"person");
		document.write(str2+"<br />");
		
		patt=/(wo)?man/g;
		patt.compile(patt);
		str2=str.replace(patt,"person");
		document.write(str2);
	
	</script>
	
输出

	Every person in the world! Every woperson on earth!
	Every person in the world! Every person on earth!	
  • exec 检索字符串中指定的值,返回找到的值,并确定其位置

      RegExpObject.exec(string)	
    

    exec() 方法用于检索字符串中的正则表达式的匹配。

参数描述
string必需,要检索的字符串
返回值返回一个数组,其中存放匹配的结果。如果未找到匹配,则返回值为 null。

说明

exec() 方法的功能非常强大,它是一个通用的方法,而且使用起来也比 test() 方法以及支持正则表达式的 String 对象的方法更为复杂。

如果 exec() 找到了匹配的文本,则返回一个结果数组。否则,返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本,第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本(如果有的话),第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本(如果有的话),以此类推。除了数组元素和 length 属性之外,exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出,在调用非全局的 RegExp 对象的 exec() 方法时,返回的数组与调用方法 String.match() 返回的数组是相同的。

但是,当 RegExpObject 是一个全局正则表达式时,exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说,您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时,它将返回 null,并把 lastIndex 属性重置为 0。

**例子**

	var pattern = /Box/g;
    var str = 'BoxssddsfBoxsboxdsf323sBox';
    var match=pattern.exec(str);
    var results=[];
    while(match != null){
        results.push(match);
        console.log(match);
        console.log(pattern.lastIndex);
        // console.log(results);
        match=pattern.exec(str);
    }
    
   输出结果
   
	   [ 'Box', index: 0, input: 'BoxssddsfBoxsboxdsf323sBox' ]
	   2017-06-01 22:08:59.205 [info][tid:com.facebook.react.JavaScript]3
	   [ 'Box', index: 9, input: 'BoxssddsfBoxsboxdsf323sBox' ]
	   2017-06-01 22:08:59.206 [info][tid:com.facebook.react.JavaScript] 12
	   [ 'Box', index: 23, input: 'BoxssddsfBoxsboxdsf323sBox' ]
	   2017-06-01 22:08:59.206 [info][tid:com.facebook.react.JavaScript] 26

exec方法执行一次只会返回一个结果

正则表达式lastindex属性表示下次匹配的起始位置,对应的,每次exec方法执行后,lastindex值都会变

而字符串match方法一次就返回所有的结果

exec要注意以下几点

* exec返回的是一个数组
* 该数组的属性有input(被匹配的整个字符串) index(匹配到第一个元素的开始位置)
* lastIndex还有个匹配到第一个属性后,指向的位置 这个属性智能由RegExp 对象!!!来访问通过这个属性可以来获取 所用所匹配到字符的字符串
  • test 检索字符串中指定的值。返回true或者false

      RegExpObject.test(string)
    

    test() 方法用于检测一个字符串是否匹配某个模式.

参数描述
string必需,要检测的字符串
返回值返回bool值,如果字符串 string 中含有与 RegExpObject 匹配的文本,则返回 true,否则返回 false。

说明

调用 RegExp 对象 r 的 test() 方法,并为它传递字符串 s,与这个表示式是等价的:(r.exec(s) != null)。

(个人理解)这句话看起来复杂,其实很好理解,r.exec(s)调用的是exec()方法,上面讲过,如果存在则返回一个数组,数组不等于空,不就是存在的意思吗?而test()方法返回bool值,如果字符串 string 中含有与 RegExpObject 匹配的文本,则返回 true,否则返回 false。所以等价!

老规矩,来个栗子

	var str = "Visit W3School";
	var patt1 = new RegExp("W3School");
	var result = patt1.test(str);
	console.log(result);

输出

	[tid:com.facebook.react.JavaScript] true

理论终于写完了,好累啊!!!

写了这么多提供点福利吧,这里提供了一个常用的js 正则封装模块,如果不够用,可以模仿添加就好了点击链接

转载于:https://my.oschina.net/KJhulinhua/blog/912876

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值