正则表达式

RegExp 是正则表达式的缩写。当检索某个文本时,可以使用一种模式来描述要检索的内容,RegExp 就是这种模式。 简单的模式可以是一个单独的字符, 更复杂的模式包括了更多的字符,并用于解析、格式检查、替换等等。
可以规定字符串中的检索位置,以及要检索的字符类型,等等。


定义和使用:

1、 使用RegExp构造函数,在运行时新建正则表达式    var patt1 = new RegExp("Hello",“i”); 

2、使用字面量,以斜杠表示开始和结束,在编译时新建正则表达式     var patt2 = /Hello/i ; 


test  方法

检索字符串中的指定值,返回值是 true 或 false

var pat = /today/; 

var str = "It is a beautiful day today..."; 

console.log(pat.test(str));   // true 


exec 方法

检索字符串中的指定值,返回值是被找到的值。如果不匹配,返回 null

var pat = /hello/; 

console.log(pat.exec("oh hello world"));  // ["hello", index: 3, input: "oh hello world"]

如果正则表示式包含圆括号(即要求“组匹配”),则返回的数组会包括多个元素。其中,第一个元素是整个匹配成功的结果,后面的元素就是圆括号对应的匹配成功的组。也就是说,第二个元素对应第一个括号,第三个元素对应第二个括号,以此类推。整个返回数组的length属性等于匹配成功的组数 + 1

var s = '_x_x';

var r = /_(x)/;

r.exec(s)    // ["_x", "x"]

exec 方法返回数组还包含以下两个属性:

input— 整个原字符串

index — 整个模式匹配成功的开始位置(从0开始)

var r = /a(b+)a/;

var arr = r.exec("_abbba_aba_");

arr   // ["abbba", "bbb"]

arr.index   // 1

arr.input    // "_abbba_aba_"


字符串查找 search()  按照给定的正则表达式进行搜索,返回一个整数,表示匹配开始的位置;如果没有任何匹配,则返回 -1 

var str="Hello W3School!"; 

console.log(str.search(/w3school/));   //-1

console.log(str.search(/w3school/i));   // 6 

正则表达式使用g修饰符之后,使用lastIndex属性指定开始匹配的位置,结果无效,还是从字符串的第一个字符开始匹配。

var r = /x/g;
r.lastIndex = 2;
  // 无效
'_x_x'.search(r)   // 1


字符串匹配match() 返回一个数组,成员是所有匹配的子字符串

var str="8 plus 32 equal 40"; 

console.log(str.match(/\d+/));   // ["8", index: 0, input: "8 plus 32 equal 40"]

console.log(str.match(/\d+/g));  // ["8", "32", "40"]

如果正则表达式带有g修饰符,则该方法与正则对象的exec方法行为不同,会一次性返回所有匹配成功的结果。

var s = "abba";  

var r = /a/g;

s.match(r)  // ["a", "a"]

r.exec(s)    // ["a"]

设置正则表达式的lastIndex属性,对match方法无效,匹配总是从字符串的第一个字符开始。


字符串替换 replace() 按照给定的正则表达式进行替换,返回替换后的字符串

var str="Hello Tom! I am sherry" 

console.log(str.replace(/tom/, "Lily"));   // Hello Tom! I am sherry

console.log(str.replace(/Tom/ig, "Mike"));   // Hello Mike! I am sherry


字符串分割 split()  按照给定规则进行字符串分割,返回一个数组,包含分割后的各个成员

var str = "Hello Tom! I am sherry."; 

str.split("");   // ["H", "e", "l", "l", "o", " ", "T", "o", "m", "!", " ", "I", " ", "a", "m", " ", "s", "h", "e", "r", "r", "y", "."]

str.split(/\s+/);  // ["Hello", "Tom!", "I", "am", "sherry."]

如果正则表达式带有括号,则括号匹配的部分也会作为数组成员返回

"aaa*a*".split(/(a*)/)         //["", "aaa", "*", "a", "*"]


1、修饰符

 i        执行对大小写不敏感的匹配

g      执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)。正则模式含有g修饰符,每次都是从上一次匹配成功处,开始向后匹配。

//不区分大小写,全局匹配 

var str="hello Hunger valley! I am hunger"; 

var patt1=/hunger/gi; 

console.log(str.match(patt1));   // ["Hunger", "hunger"]


lastIndex : 返回下一次开始搜索的位置,该属性可读写,但只在设置了g修饰符时有意义。

source : 返回正则表达式的字符串形式(不包括反斜杠),该属性只读。

var r = /abc/ig;

r.lastIndex     // 0

r.source    // "abc"


2、方括号:用于查找某个范围内的任意一个字符

[abc]         查找方括号之间的任意一个字符

[^abc}       查找不在方括号之间的任意一个字符,^ (脱字符只有在字符类的第一个位置才有特殊含义,否则就是字面含义)

如果方括号内没有其他字符,即只有[^],就表示匹配一切字符,其中包括换行符,而点号(.)是不包括换行符的

var s = 'Please yes\nmake my day!';
s.match(/yes.*day/)
   // null

s.match(/yes[^]*day/) // ['yes\nmake my day']

[0-9]          查找任意一个从 0 到 9 的数字

[a-z]           查找任意一个从小写 a 到小写 z 的字符

[A-Z]           查找任意一个从大写 A 到大写 Z 的字符

[A-z]            查找任意一个从大写 A 到小写z 的字符


- (连字符,提供简写形式,表示字符的连续范围,要用在方括号之中,并且在头尾两个字符中间)

比如,[abc]可以写成[a-c][0123456789]可以写成[0-9],同理[A-Z]表示26个大写字母。

/a-z/.test('b')    // false

/[a-z]/.test('b')  // true

[-9]就表示匹配连字符和9,而不是匹配0到9。

[1-31],不代表1到31,只代表1到3

[adgk]        查找给定集合内的任何字符

[^adgk]       查找给定集合外的任何字符

(red|blue|green)     查找任何指定的选项,竖线符号(|)在正则表达式中表示“或关系”(OR)


3、元字符(Metacharacter)

.            匹配单个字符,除了换行 (\n) 、回车 (\r) 、行分隔符 (\u2028)、段分隔符 (\u2029)

\w         匹配任意一个字母或数字或下划线,即 A~Z , a~z , _ 中任意一个,相当于[A-Za-z0-9_]

\W         查找非单词字符,相当于[^A-Za-z0-9_]

\d          匹配任意一个数字,0~9中的任意一个,相当于[0-9]

\D         查找非数字字符,相当于[^0-9]

\s          匹配空格、制表符、换页符等空白字符的任意一个,相等于[\t\r\n\v\f]

\S         查找非空白字符,相当于[^\t\r\n\v\f]

\b          匹配单词边界,本身不匹配任何字符,它在匹配结果中所处位置的左右两边,一边是 "/w' 范围,一边非 "/w" 范围

\B         匹配非单词边界,即在词的内部

\0          查找NULL字符

\n          查找换行符,通常,正则表达式遇到换行符(\n)就会停止匹配。

\f          查找换页符

\r           查找回车符

\t           查找制表符 tab 

\v          查找垂直制表符

\xxx       查找以八进制数 xxx 规定的字符

\xdd      查找以十六进制数 dd 规定的字符

\uxxxx   查找以十六进制数 xxxx 规定的 Unicode 字符


4、量词

n+              匹配任何包含至少一个 n 的字符串,相当于 {1,}

n*              匹配任何包含零个任意个 n 的字符串,相当于 {0,}

n?             匹配任何包含零个一个 n 的字符串,相当于 {0,1}

n{X}          匹配包含 X 个 n 的序列的字符串

n{X,Y} 匹配包含 X 至 Y 个 n 的序列的字符串,例如:"at{1,3}" 可以匹配 "at" 或 "att" 或 "attt"

n{X,}         匹配包含至少 X 个 n 的序列的字符串

n$            匹配任何结尾为 n 的字符串

^n             匹配任何开头为 n 的字符串

?=n          匹配任何其后紧接指定字符串 n 的字符串

?!n 匹配任何其后没有紧接指定字符串 n 的字符串


5、简单的转义字符(^.[$()|*+?{\\这12个字符需要用斜杠转义

\^            匹配 ^ 符号本身

\$           匹配 $ 符号本身

\.            匹配小数点本身

如果使用RegExp方法生成正则对象,转义需要使用两个斜杠,因为字符串内部会先转义一次。


贪婪模式 

+、*、? 这三个量词符,默认情况下都是最大可能匹配,即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。

var s = 'aaa';
s.match(/a+/)
   // ["aaa"]

如果想将贪婪模式改为非贪婪模式,可以在量词符后面加一个问号

var s = 'aaa';
s.match(/a+?/)
   // ["a"]

模式结尾添加了一个问号/a+?/,这时就改为非匹配模式,一旦条件满足,就不再往下匹配。


组匹配

1、使用组匹配时,不宜同时使用g修饰符,否则match方法不会捕获分组的内容。

var m = 'abcabc'.match(/(.)b(.)/g);
m    //  ["abc", "abc"]

var m = 'abcabc'.match(/(.)b(.)/);

m   // ["abc", "a", "c"]

2、在正则表达式内部,可以用\n引用括号匹配的内容,n是从1开始的自然数,表示对应顺序的括号。

/(.)b(.)\1b\2/.test("abcabc")  // true   \1表示前一个括号匹配的内容(即“a”),\2表示第二个括号匹配的内容(即“c”)

非捕获组

(?:x)称为非捕获组(Non-capturing group),表示不返回该组匹配的内容,即匹配的结果中不计入这个括号。

var m = 'abc'.match(/(?:.)b(.)/);
m    // ["abc", "c"]

先行断言

x(?=y)称为先行断言(Positive look-ahead),x只有在y前面才匹配,y不会被计入返回结果。

var m = 'abc'.match(/b(?=c)/);
m  // ["b"]

后行断言

x(?!y)称为后行断言(Negative look-ahead),x只有不在y前面才匹配,y不会被计入返回结果。

var m = 'abd'.match(/b(?!c)/);
m   // ["b"]

/\d+(?!\.)/.exec('3.14')    // ["14"]


最后,分享两个不错的网站:

正则表达式调试工具     http://www1.w3cfuns.com/tools.php?mod=regex

分析工具     http://regexper.com/


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值