正则表达式形象化网站:https://regexper.com/
一、RegExp对象
JavaScript通过内置对象RegExp支持正则表达式
有两种方法支持实例化RegExp对象
-
字面量
例如:var reg = /\b
is\b
/g;(这里的 \b 代表单词边界) -
构造函数
例如:var reg = new RegExp(’\bis\b’,‘g’);
(修饰符:1.g:global 全文搜索,不添加,搜索到第一个就匹配停止
2.i:ignore case 忽略大小写,默认大小写敏感
3.m:multiline,可以进行多行匹配,但是只有使用^和$模式时才起作用,在其他模式中,加不加入m都可以进行多行匹配)
二、元字符
正则表达式由两种基本字符类型组成 -
原义文本字符
-
元字符(在正则表达式中有特殊含义的非字母字符,例如:
* + ? $ ^ . | \ () {} []
等)
三、字符类
我们可以使用元字符[]
来构建一个简单的类。所谓类是指某些特性的对象,一个泛指,而不是某个字符。表达式[abc]
把a
或b
或c
归为一类,表达式可以匹配这类的字符。
字符类取反:使用元字符 k 创建 反向类/负向类(指不属于某类的内容),表达式 [^abc] 表示不是字符 a 或 b 或 c 的内容。
四、范围类
我们可以使用[a-z]
来连接两个字符表示从a
到z
的任意字符,这是个闭区间,也包含a
和z
本身。在[]
组成的类内部是可以连写的[a-zA-Z]
。
五、预定义类及边界
正则表达式提供预定义类
来匹配常见的字符类
例如:匹配一个ab+数字+任意字符
的字符串 ab\d. (不用预定义类: ab[0-9][^\r\n])
正则表达式还提供了几个常用的边界
匹配字符
例如:’@123@abc@’.replace(/@.
/g,‘Q’) → Q23Qbc@
‘@123@abc@’.replace(/^@.
/g,‘Q’) → Q23@abc@
‘@123@abc@’.replace(/.@
/g,‘Q’) → @12QabQ
‘@123@abc@’.replace(/.@$
/g,‘Q’) → @123@abQ
六、量词
例如:\d{20}
匹配一个出现20次数字的字符串
七、JS正则贪婪模式与非贪婪模式 -
贪婪模式:正则表达式在匹配时会尽可能多的匹配
例如:‘12345678’.repalce(/\d{3,6}
/g,‘X’) → X78 -
非贪婪模式:让正则表达式尽可能少的匹配,即一旦匹配成功就不再继续尝试匹配(做法很简单,在量词后加上
?
即可)
例如:‘123456789’.match(/\d{3,5}?
/g) → [“123”,“456”,“789”]
‘12345678’.repalce(/\d{3,6}?
/g,‘X’) → XX78
八、分组 -
使用
()
可以达到分组的功能,使量词作用于分组
例如:匹配字符串 Byron 连续出现3次的场景 → (Byron){3}
(Byron{3} → 表示匹配Byro和n为3次的场景) -
使用 | 可以达到或的效果
例如:‘ByronCasper’,replace(/Byron|Casper/g,‘X’) → XX
‘ByronsperByrCasper’,replace(/Byr(on|Ca)sper/g,‘X’) → XX -
反向引用
需求:2020-02-26 → 02/26/2020
‘2020-02-26’.replace(/(\d{4})-(\d{2})-(\d{2})/g,’$2/$3/$1’) → 02/26/2020 -
忽略分组
不希望捕获某些分组,只需要在分组内前面加上?:
就可以
例如:(?:Byron).(ok) 这样就忽略掉 Byron 这个分组了
九、前瞻 -
正则表达式从文本头部向尾部开始解析,文本尾部方向,称为"前"
-
前瞻就是在正则表达式匹配到规则的时候,向前检查是否符合断言,后顾/后瞻方向相反
-
JavaScript不支持后顾
-
符合和不符合特定断言称为肯定/正向匹配和否定/负向匹配
例如:'a23’.replace(/\w(?=\d)/g,‘X’) → X23
'a234v8’.replace(/\w(?=\d)/g,‘X’) → X2X4X8
'a234vv’.replace(/\w(?=\d)/g,‘X’) → X2X4vv
'a234vv’.replace(/\w(?!\d)/g,‘X’) → aX3XXX
十、JS对象属性 -
global: 是否全文搜索,默认false
-
ignore case: 是否大小写敏感,默认false
-
multiline: 多行搜索,默认false
-
lastIndex: 是当前表达式匹配内容的最后一个字符的下一个位置
-
source: 正则表达式的文本字符串
十一、正则表达式本身的test和exec方法(RegExp对象的方法)
RegExp.portotype.test(str)
用于测试字符串参数中是否存在匹配正则表达式模式的字符串,如果存在则返回 true ,否则返回 false
例如:var reg2 = /\w/g;
用reg2.test(‘a’)多次执行会得到 → true → false→ true → false。是由于全局匹配,会根据reg2 的lastIndex这样来匹配
RegExp.portotype.exec(str)
使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果,如果没有匹配的文本则返回 null,否则返回一个结果数组: -
index 声明匹配文本的第一个字符的位置
-
input 存放被检索的字符串 string
— 非全局调用- 调用非全局的 RegExp 对象的 exec() 时,返回数组
- 第一个元素是与正则表达式相匹配的文本
- 第二个元素是与 RegExp 对象的第一个子表达式相匹配的文本(如果有的话)
- 第三个元素是与 RegExp 对象的第二个子表达式相匹配的文本(如果有的话),以此类推
— 全局调用
例如:var reg4 = /\d(\w)(\w)\d/g;
var ts = ‘$1az2bb3cy4dd5ee’;
var ret = reg3.exec(ts);
while ( ret = reg4.exec(ts) ) {
console.log( reg4.lastIndex + ‘\t’ + ret.index + ‘\t’ + ret.toString());
}
→
“5 1 1az2,a,z”
“11 7 3cy4,c,y”
十二、字符串对象方法
String.portotype.search(reg)
search() 方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,方法返回第一个匹配结果 index ,查找不到返回 -1。search() 方法不执行全局匹配,它将忽略标志 g ,并且总是从字符串的开始进行检索
String.portotype.match(reg)
match() 方法将检索字符串,以找到一个或多个与 regexp 匹配的文本
regexp 是否具有标志 g 对结果影响很大
1.非全局调用
- 如果regexp 没有标志 g ,那么 match() 方法就只能在字符串中执行一次匹配
- 如果没有找到任何文匹配的文本,将返回 null
- 否则它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
- 返回数组的第一个元素存放的时匹配文本,而其余的元素存放的是与正则表达式子表
达式匹配的文本 - 除了常规的数组元素之外,返回的数组还含有 2 个对象属性
- index 声明匹配文本的起始字符在字符串中的位置
- input 声明对 stringObject 的引用
例如:var reg3 = /\d(\w)\d/;
var ts = ‘$1a2b3c4d5e’;
var ret = ts.match(reg3);
console.log(ret); → [“1a2”,“a”]
console.log(ret.index + ‘\t’ + reg3.lastIndex); → “1 0”
2.非全局调用
- 如果regexp 具有标志 g ,那么 match() 方法将执行全局检索,找到字符串中的所有匹配子
字符串 - 如果没有找到任何文匹配的文本,将返回 null
- 否则它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
- 数组元素中存放的是字符串中所有的匹配子串,而且也没有index属性或input属性
例如:var reg4 = /\d(\w)\d/g;
var ts = ‘$1a2b3c4d5e’;
var ret = ts.match(reg4);
console.log(ret); → [“1a2”,“3c4”]
console.log(ret.index + ‘\t’ + reg3.lastIndex); → “undefined 0”
String.portotype.split(reg)
我们经常使用 split() 方法把字符串分割成字符数组
‘a,b,c,d’.split(’,’); → [“a”,“b”,“c”,“d”]
在一些复杂的分割情况下我们可以使用正则表达式解决
‘a1b2c3d’.split(/\d/); → [“a”,“b”,“c”,“d”]
String.portotype.replace(reg)
String.prototype.replace(str,replaceStr)
String.prototype.replace(reg,replaceStr)
String.prototype.replace(reg,function)
function参数含义
function会在每次匹配替换的时候调用,有四个参数
1、匹配字符串
2、正则表达式分组内容,没有分组则没有该参数
3、匹配在字符串中的index
4、原字符串
例如:
‘a1b2c3d4e5’.replace(/\d/g,function(match,index,origin)){
console.log(index);
return parseInt(match) + 1;
}
→
1 3 5 7 9 “a2b3c4d4e6”
‘a1b2c3d4e5’.replace(/(\d)(\w)(\d)/g,function(match,group1,group2,group3,index,origin)){
console.log(match);
return group1 + group3;
}
→
“1b2” “3d4” “a12c34e5”