JavaScript之RegExp类型

RegExp类型

RegExp类型支持正则表达式,正则表达式是 描述模式 的对象。

正则表达式用于对字符串模式的匹配、检索、替换。

语法:

构造函数创建的正则表达式:

var patt = new RegExp(pattern,flags);

pattern、flags均用双引用括起来



字面量形式创建的正则表达式:

var patt = /pattern/flags;

其中,pattern为字符模式,模式可以为字符类、限定符、分组、向前查找及反向应用等,在构造函数中用双引号括起来。

flags为标示修饰符,每个模式可以有一个或多个标示修饰符,用以标明模式的行为


正则表达式的标示修饰符有3个:


g:全局(global)模式,模式将被用于所有字符串,而不是发现第一个匹配项时就立即停止。


i: 不区分大小写,在确定匹配项时忽略模式与字符串的大小写。


m:多行模式,到达一行文本末尾 时继续查找下一行文本中是否存在与模式相匹配的项。


所以一个正则表达式就是 模式 标示修饰符的组合体。

// 匹配字符中所有"at"的实例
var pattern1 = new RegExp("at", g);
var pattern1 = /at/g; 


//匹配字符"at"或"ct"的实例,不区分大小写。

var pattern2 = /[at]ct/gi;

//匹配以"a"结尾的实例

var pattern3 = /.a/gi;

模式中使用的元字符都必须转义,正则表达式中的元字符有:


( [ { \ ^ $ | ) ? * + . ] }


如果想要在 匹配的字符中包含元字符,则需要对这些元字符进行转义。如

/* 匹配第一个"[bat]cat",不区分大小写 */

var pattern1 = /\[bat]\cat/i; //需对[]转义

/* 匹配所有".at" ,不区分大小写*/

var pattern2 = /\.at/gi;


除了用字面量形式定义正则表达式外,还可以用构造函数RegExp()来创建正则表达式,构造函数中的模式是字符串形式,因此有时对字符进行双重转义,在字面量形式中,包含元字符的需要用"\"转义,在构造函数中,需要用"//"来转义元字符

如:

//匹配所有".at",不区分大小写。
var pattern1 = /\.at/i; //字面量模式

var pattern2 = new RegExp("\\.at", "i"); //构造函数形式
   

一些已经转义过的字符,如\n、\b等,在字面量模式中为/\\n/、/\\b/,而在构造函数中为"\\\n"、"\\\b"。

正则表达式字面量形式始终共享一个RegExp()实例,由于实例属性不会重置,再次访问该字面量形式时会失败。


构造函数创建的每一个RegExp实例都是一个新的RegExp实例。所以可以多次访问。


var re = unll,
i;


for (i = 0; i < 10, i++){
    re = /cat/g;  //字面量形式创建的正则表达式共享一个RegExp实例,第一次访问后实例属性就不会重置了
    re.test("catastrong");//
}


for (i = 0; i < 10, i++) {
    re = new RegExp("cat", "g");
    re.test("catastrong");
}

第一个循环中,即使循环体中指定的,但实际上只为/cat/创建了一个RegExp实例,字面量模式共享一个RegExp实例,由于实例属性不能重置,所以在循环中再次调用test()函数会失败,第一次调用test()已经找到"cat"了,再次调用会从 索引为3 的位置开始的,所以找不到它了。第二个循环中,每次循环都会创建一个新的RegExp实例,所以每次调用都会返回true。


RegExp实例属性


每个RegExp实例都有实例属性,这些属性取得模式的相关信息:



global:布尔值,表示是否设置了g标志修饰符。


ignoreCase:布尔值,表示是否设置了i标志修饰符。


lastIdex:整数,表示开始搜索下一个匹配项的字符位置,开始为0。


multitine:布尔值,表示设置了m标志修饰符。


source:正则表达式的 字符串形式表示,按 字面量形式 而非传入构造函数中的字符串模式返回。



var pattern1 =/\[bc\]at/i;//不区分大小写,查找"[bc]at"


console.log(pattern1.global);//返回false,未设置g标志


console.log(pattern1.ignoreCase); //返回true,设置为i标志


console.log(pattern1.multiline);  //返回false,未设置m标志


console.log(pattern1.source); //返回字面量形式的字符串,即:"\[bc\]at"




var pattern2 = new RegExp("\\[bc\\]at", "i"); //用构造函数创建正则表达式


console.log(pattern2.global);//返回false,未设置g标志


console.log(pattern2.ignoreCase); //返回true,设置为i标志


console.log(pattern2.multiline);  //返回false,未设置m标志


console.log(pattern2.source); //返回的还是字面量形式的字符串,即:"\[bc\]at"


我们发现,尽管第一个模式使用的是字面量,第二修模式使用了构造函数,但它们的source值是一样的,可见source保存的是规范的字符串,即字面量形式的字符串是规范的



RegExp属性方法

exec()方法

该方法用于 检索字符串中正则表达式的匹配,exec()接受一个参数,即要应用模式的字符串。然后返回包含第一个匹配项信息的数组。如果字符串有匹配的值(正则表达式模式中的值)返回该匹配值,并确定其位置(索引index),没有返回null。额外的属性:index表示所查找的存在的匹配在字符串的位置索引,input表示应用于正则表达式的字符串。

var pattern1 = "Hello RegExp";


//检索Hellow
var patt = /Hello/gi; //不分大小写查找Hello


var result = patt.exec(pattern1); //检索字符串中是否有Hello,如果有返回其值,并确定其位置index。


document.write(result); //Hello


document.write(result.index); //0 index表示匹配值在字符串中的索引位置


//检索RegExp
var patt1 = /RegExp/gi;


var result1 = patt1.exec(pattern1)


document.write(result); //RegExp


document.write(result.index); //索引位置在6


注:

exec()方法始终返回一个匹配项,在没有设置全局模式g下,在同一字符串上多次调用exec()方法,始终返回第一个匹配项信息。在设置了全局模式g下,每次调用exec()方法,则就会从字符串中继续查找新匹配项,返回下一个匹配到的项的信息。


test()方法

该方法检测一个字符串是否匹配某个模式(正则表达式中的模式)。换句话说就是检测字符串是否有正则表达式中模式的值,如果字符中有匹配的值返回true,否则返回false。

var text = "hellow world!";


var patt = /hellow/gi;


var result = patt.test(text);//检测字符串是否匹配某个模式。


console.log(result); //返回true,字符串"hellow world!"有匹配的值"hellow"。


var patt1 = /javascript/gi;//创建正则表达式


var result1 = patt1.test(text); //检测字符串是否匹配该模式。


console.log(result1); //返回false,因为"hellow world!"中没有匹配值"javascript"。


exec()与test()的区别:

exec()是检测字符串中是否有正则表达式模式中的值,如果有的话返回 包含第一个匹配项信息的数组,index属性表示其字符模式的位置索引,没有返回 null

test()是检测字符串中是否有正则表达式模式中的值,如果有的话返回 true没有返回 false。多用于检测输入格式正确否。


一个是返回匹配值的数组,一个是返回布尔值。

RegExp实例继承的toString()方法toLocalString()方法返回的是字面量形式的字符串(规范的字符串),即"/.../"中的字符串

var patt = new RegExp("\\[bt\\]ct", "i"); //在字面量中的形式是"\[bt\]ct"

console.log(patt.toString()); //返回的是"\[bt\]ct"


RegExp构造函数属性

RegExp构造函数属性适用于作用域中的所有正则表达式,跟 执行的最近一次匹配有关。这些属性有两种方式访问它们:长属性和短属性。

长属性格式如:RegExp.input  表示返回最近一次要匹配的字符串。

短属格式:RegExp["$+"]  表示最近一次匹配的捕获组。


RegExp构造函数的属性有:长属性(短属性)  

  • input($_):最近一次匹配的字符串
  • lastMatch($&):最近一次的匹配项
  • lastParen($+):最近一次匹配的捕获组
  • leftContext($`)inputlastMatch之前的文本,即最近一次的匹配项左边的文本。
  • rightConext($')inputlastMatch之后的文本,即最近一次的匹配项右边的文本。
  • multiline($*):布尔值,表示表达式是否使用多行模式。

使用这些属性可以从exec()方法和test()方法中得到更具体的信息。

举例:从字符串“this has been a short summer”中的“short”左右文本中提取有用信息。

    var test = "this has been a short summer"; //要匹配的字符串
    var parrt = /(.)hort/g; // 在全局模式中捕获以任何字符开头的字符串".hort"

    if (parrt.test(test)) {
    	console.log(RegExp.input); //this has been a short summer 最近一次要匹配的字符串test
    	console.log(RegExp.lastMatch); //short 最近一次的匹配项
    	console.log(RegExp.lastParen); //s 匹配的捕获组
    	console.log(RegExp.leftContext); //this has been a 匹配项之前的文本
    	console.log(RegExp.rightContext); //summer 匹配项之后的文本
    	console.log(RegExp.multiline); //false 没有使用多行模式
    }

以上例子是以长属性得到的信息,下列使用短属性也可以得到相同的信息:

    var test = "this has been a short summer"; //要匹配的字符串
    var parrt = /(.)hort/g; // 在全局模式中捕获以任何字符开头的字符串".hort"

    if (parrt.test(test)) {
    	console.log(RegExp.$_); //this has been a short summer 最近一次要匹配的字符串
    	console.log(RegExp["$&"]); //short 最近一次的匹配项
    	console.log(RegExp["$+"]); //s 匹配的捕获组
    	console.log(RegExp["$`"]); //this has been a 匹配项之前的文本
    	console.log(RegExp["$'"]); //summer 匹配项之后的文本
    	console.log(RegExp["$*"]); //false 没有使用多行模式
    }


RegExp构造函数的其它属性如:RegExp.$1~RegExp.$9分别表示用于存储第一、第二、第三、......第九个匹配的捕获组。

如以上例子中匹配的捕获组就是"s"。那么:

console.log(RegExp.$1); //s
console.log(RegExp.$2); //
console.log(RegExp.$3); //
console.log(RegExp.$9); //

因为只有一个捕获组"s",所以第一个捕获组就是"s",而其它的捕获组就是没有。


常见元字符的转义

\w:查找单词字符。

\W:查找非单词字符。

\d:查找数字字符。

\D:查找非数字字符。

\s:查找空白字符。

\S:查找非空白字符。

\n:查找换行符。


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值