ES5 - 正则表达式 ( 详解 )

正则表达式

正则表达式是由一个字符序列形成的搜索模式。当你在文本中搜索数据时,你可以用搜索模式来描述你要查询的内容。正则表达式经常用于文本搜索和文本替换的操作。

1. 字符分类

  • 普通字符
    字母、数字、下划线、汉字、没有特殊含义的符号
  • 特殊字符
    \:将特殊字符转义成普通字符
  • 模式修饰符
    i:ignoreCase,匹配时忽视大小写
    m:multiline,多行匹配
    g:global,全局匹配

2. 正则表达式的创建

  • 字面量(直接量)

    // 在一对反斜线中写正则表达式内容,如/abc/
    // 正则表达式里面不需要加引号 不管是数字型还是字符串型
    var reg = /正则表达式/修饰符;
    var reg = /hello/g;
    
  • 构造函数

    //构造正则表达式的实例,如new RexExp('abc')
    //内部传入的参数为字符串/字符串的变量
    var reg =new RegExp("正则表达式","修饰符")
    var reg =new RegExp("hello","g");
    

3. 正则表达式实例方法

  • exec

    可用来匹配字符串中符合正则表达式的字符串,如果匹配到,返回值是一个result数组,否则返回null

    var str = 'hello world hello';
    var reg1 = /hello/;
    var reg2 = /hello/g;
    var reg3 = /exe/g;
    console.log(reg1.exec(str)); //[ 'hello', index: 0, input: 'hello world hello', groups: undefined ]
    console.log(reg2.exec(str)); //[ 'hello', index: 0, input: 'hello world hello', groups: undefined ]
    console.log(reg3.exec(str)); // null
    
    // 如果是全局模式的正则验证 还可以使用循环进行输出
    while(true){
    	var result = reg2.exec(str); //循环得用 g 全局匹配
    	if(!result){
    		break;
    	}
    	console.log(result[0],result["index"],reg.lastIndex);
    }
    

    注意:

    1. 如果正则表达式中 有修饰符"g" 时,在正则表达式的实例reg中会维护lastIndex属性,记录下一次开始的位置,当第二次执行exec的时候,从lastIndex开始检索

    2. 如果正则表达式中没有修饰符"g",不会维护lastIndex属性,每次执行从开始位置检索

  • test

    用来测试待检测的字符串中是否有可以匹配到正则表达式的字符串,如果有返回true,否则返回false

    var str = 'hello world';
    var reg1 = /world/;
    var reg2 = /Regex/;
    console.log(reg1.test(str)); //返回true
    console.log(reg2.test(str)); //返回false
    
  • toString/toLocaleString

    把正则表达式的内容转化成字面量形式字符串/有本地特色的字符串(JS中没效果

    var reg1 = /hello/;
    console.log(reg1.toString()); //返回 /hello/ 字符串
    console.log(reg1.toLocaleString()); //返回 /hello/ 字符串
    

4. 正则表达式实例属性

  • lastIndex

    当没设置全局匹配时,该属性值始终为0
    设置了全局匹配时,每执行一次exec/test来匹配,lastIndex就会移向匹配到的字符串的下一个位置,当指向的位置后没有可以再次匹配的字符串时,下一次执行exec返回null,test执行返回false,然后lastIndex归零,从字符串的开头重新匹配一轮,可以理解成,每次正则查找的起点就是lastIndex

    var str = 'hello hello hello';
    var reg1 = /hello/;
    var reg2 = /hello/g;
    console.log(reg1.lastIndex);  // 0
    console.log(reg1.exec(str));  // 返回第一个hello
    console.log(reg1.lastIndex);  // 0
    
    console.log(reg2.lastIndex);  // 0
    console.log(reg2.exec(str));  // 返回第一个hello
    console.log(reg2.lastIndex);  // 5
    
    console.log(reg2.lastIndex);  // 5
    console.log(reg2.exec(str));  // 返回第二个hello
    console.log(reg2.lastIndex);  // 11
    
    console.log(reg2.lastIndex);  // 11
    console.log(reg2.exec(str));  // 返回第三个hello
    console.log(reg2.lastIndex);  // 17
    
    console.log(reg2.exec(str));  //返回 null
    
    console.log(reg2.lastIndex);  // 0
    console.log(reg2.exec(str));  // 返回第一个hello
    
  • ignoreCase、global、multiline

    判断正则表达式中是否有忽略大小写、全局匹配、多行匹配三个模式修饰符

    var reg1 = /hello/igm;
    console.log(reg1.ignoreCase); //true
    console.log(reg1.global); //true
    console.log(reg1.multiline);  //true
    
  • source

    返回字面量形式的正则表达式(类似于toString

    var reg1 = /hello/igm;
    console.log(reg1.source); //hello
    

5. 正则表达式语法-元字符

  • 字符集合

    一个字符集合,也叫字符组。匹配集合中的任意一个字符。方括号用于查找某个范围内的字符,使用连字符‘-’指定一个范围

    [abc] 查找方括号之间的任何字符

    var str = 'abc qwe abd'
    var reg1 = /[abc]/;// 只要包含有a 或者 包含有b 或者包含有c 都返回为true
    console.log(reg1.test(str)); //true
    

    [0-9] 查找任何从0至9的数字

    var str = 'abc qwe abd1'
    var reg1 = /[0-9]/igm;
    console.log(reg1.test(str)); //true
    

    ^写在[ ]里面是反义字符组,它匹配任意不在括号内的字符

    var str = 'abc qwe abd1,2'
    console.log(str);
    var reg1 = /[^abc ]/igm;
    console.log(reg1.exec(str)); //true
    

  • 边界符

    ^ 匹配输入开始。表示匹配行首的文本(以谁开始)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。

    $ 匹配输入结尾。表示匹配行尾的文本(以谁结束)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。

    如果 ^和 $ 在一起,表示必须是精确匹配。

    var rg = /abc/; 
    // /abc/ 只要包含有abc这个字符串返回的都是true
    console.log(rg.test('abc'));  //true
    console.log(rg.test('abcd')); //true
    console.log(rg.test('aabcd'));//true
    console.log('---------------------------');
    // 必须是以abc开头的字符串才会满足
    var reg = /^abc/;
    console.log(reg.test('abc')); // true
    console.log(reg.test('abcd')); // true
    console.log(reg.test('aabcd')); // false
    console.log('---------------------------');
    // 必须是以abc结尾的字符串才会满足
    var reg = /abc$/;
    console.log(reg.test('abc')); // true
    console.log(reg.test('qweabc')); // true
    console.log(reg.test('aabcd')); // false
    console.log('---------------------------');
    var reg1 = /^abc$/; // 精确匹配 要求必须是 abc字符串才符合规范
    console.log(reg1.test('abc')); // true
    console.log(reg1.test('abcd')); // false
    console.log(reg1.test('aabcd')); // false
    console.log(reg1.test('abcabc')); // false
    

  • 字符集合与"^“和”$"一起使用

    // 三选一 只有是a 或者是 b  或者是c 这三个字母才返回 true
    var rg1 = /^[abc]$/; 
    console.log(rg1.test('aa'));//false
    console.log(rg1.test('a'));//true
    console.log(rg1.test('b'));//true
    console.log(rg1.test('c'));//true
    console.log(rg1.test('abc'));//false
    //26个英文字母任何一个字母返回 true  - 表示的是a 到z 的范围  
    var reg = /^[a-z]$/ 
    console.log(reg.test('a'));//true
    console.log(reg.test('z'));//true
    console.log(reg.test('A'));//false
    //字符组合
    // 26个英文字母(大写和小写都可以)任何一个字母返回 true
    var reg1 = /^[a-zA-Z0-9]$/; 
    //取反 方括号内部加上 ^ 表示取反,只要包含方括号内的字符,都返回 false 。
    var reg2 = /^[^a-zA-Z0-9]$/;
    console.log(reg2.test('a'));//false
    console.log(reg2.test('B'));//false
    console.log(reg2.test(8));//false
    console.log(reg2.test('!'));//true
    

  • 字符类

    在这里插入图片描述

6. 数量词

在这里插入图片描述

  • X* 匹配前面的模式 x -> 0 或多次。等价于{0,}

    // * 允许出现0次或多次
    var reg = new RegExp(/^a*$/);
    console.log(reg.test("a")); // true
    console.log(reg.test("")); // true
    
  • X+ 匹配前面的模式 x -> 1 或多次。等价于 {1,}

    // + 允许出现1次或多次
    var reg2 = new RegExp(/^a+$/);
    console.log(reg2.test("a")); // true
    console.log(reg2.test("")); // false
    
  • X? 匹配前面的模式 x -> 0 或 1 次。等价于{0,1}

    // ? 只允许a出现1次或0次
    var reg3 = new RegExp(/^a?$/);
    console.log(reg3.test("a")); // true
    console.log(reg3.test("")); // true
    console.log(reg3.test("aaa")); // false
    
  • X{n} n为非负整数。前面的模式 x 重复出现 n 次时匹配

    // {3} 允许重复3次
    var reg4 = new RegExp(/^a{3}$/);
    console.log(reg4.test("a")); // false
    console.log(reg4.test("")); // false
    console.log(reg4.test("aaa")); // true
    console.log(reg4.test("aaaa")); // false
    
  • X{n,} n为非负整数。前面的模式 x 重复出现至少 n 次时匹配。

    // {3,} 允许重复出现3次或3次以上多次
    var reg5 = new RegExp(/^a{3,}$/);
    console.log(reg5.test("a")); // false
    console.log(reg5.test("")); // false
    console.log(reg5.test("aaa")); // true
    console.log(reg5.test("aaaa")); // true
    
  • X{n,m} n和m为非负整数。前面的模式 x 重复出现至少 n 次,至多 m 次时匹配。

    // {3,6} 允许重复出现3次-6次之间,也就是>=3且<=6
    var reg6 = new RegExp(/^a{3,6}$/);
    console.log(reg6.test("a")); // false
    console.log(reg6.test("aaaa")); // true
    console.log(reg6.test("aaaaaa")); // true
    console.log(reg6.test("aaaaaaa")); // false
    
  • 案例 : 匹配QQ号

    // 不能以数字0开始,只能由数字组成,长度为5-11位
    var reg = /^[1-9]\d{4,10}$/;
    var str1 = "12311111111";
    var result1 = reg.exec(str1);
    console.log(result1);
    
  • 案例 : 匹配身份证号

    // 不能以数字0开头,只能由数字组成,最后一位可能是x,X,数字
    var reg = /^[1-9]\d{16}[xX\d]$/;
    var str = "456337189654326541";
    var result = reg.exec(str);
    console.log(result);
    

贪婪模式

尽可能多的匹配(首先取最多可匹配的数量为一组进行匹配),当匹配剩余的字符串,还会继续尝试新的匹配,直到匹配不到为止,为默认模式

// 对字符串"123456789",匹配其中的数字3-6次:\d{3,6},先匹配数字出现6次的字符串(123456)
// 然后再从剩余字符串(789)中匹配出现数字3次的情况,剩余字符若没有出现数字3次则停止匹配.
var str = "123456789";
var reg = /\d{3,6}/g;
console.log(reg.exec(str)); //[ '123456', index: 0, input: '12345678', groups: undefined ]
console.log(reg.exec(str)); // [ '789', index: 6, input: '123456789', groups: undefined ]
console.log(reg.exec(str)); // null

非贪婪模式

尽可能少的匹配(每次取最少匹配的数量为一组进行匹配),直到匹配不到为止

使用方法 :在量词后加上

// 对字符串"123456789",匹配其中的数字3-6次:\d{3,6},先匹配数字出现3次的字符串(123)
// 然后再从剩余字符串(456789)中匹配出现数字3次的情况,剩余字符若没有出现数字3次则停止匹配.
var str = "123456789";
var reg = /\d{3,6}?/g;
console.log(reg.exec(str)); //[ '123', index: 0, input: '123456789', groups: undefined ]
console.log(reg.exec(str)); // [ '456', index: 3, input: '123456789', groups: undefined ]
console.log(reg.exec(str)); // [ '789', index: 6, input: '123456789', groups: undefined ]

7 . 选择 、分组 、引用

  • 选择

    字符|用于分隔供选择的字符,选择项的尝试匹配次序是从左到右,直到发现了匹配项,如果左边的选择项匹配,就忽略右边的匹配项,即使它可以产生更好的匹配。

    var reg = /html|css|js/
    console.log(reg.exec('qweqwehtmlcss')); // html
    
  • 分组

    有圆括号包裹的一个小整体成为分组。

    /HuAHuAHuA/
    // 俩种表达式一样
    /(HuA){3}/   //分组
    
  • 候选

    一个分组中,可以有多个候选表达式,用 | 分隔

    var reg = /I Like (basketball|football|table tennis)/
    console.log(reg.test('I Like basketball')); //true
    console.log(reg.test('I Like football')); //true
    console.log(reg.test('I Like table tennis')); //true
    

8. 捕获与引用

  • 捕获

    被正则表达式匹配(捕获)到的字符串会被暂存起来。其中,由分组捕获的串会从1开始编号,于是我们可以引用这些串:

    var reg = /(\d{4})-(\d{2})-(\d{2})/
    
    var date = '2021-08-29'
    
    reg.test(date)
    // 捕获之前要先test/exec
    console.log(RegExp.$1); //2021
    console.log(RegExp.$2); //08
    console.log(RegExp.$3); //29
    

    嵌套分组的捕获

    规则是以左括号出现的顺序进行捕获。

    var reg = /((apple) is (a (fruit)))/
    var str = "apple is a fruit"
    reg.test(str) // true
    RegExp.$1 // apple is a fruit
    RegExp.$2 // apple
    RegExp.$3 // a fruit
    RegExp.$4 // fruit
    
  • 引用

    正则表达式里也能进行引用,这称为反向引用:

    var reg = /(\w{3}) is \1/
    console.log(reg.test('kid is kid')); // true
    console.log(reg.test('dik is dik')); // true
    console.log(reg.test('kid is dik')); // false
    console.log(reg.test('dik is kid')); // false
    

    \1 引用了第一个被分组所捕获的串,换言之,表达式是动态决定的。

    如果编号越界了,则会被当成普通的表达式:

    var reg = /(\w{3}) is \6/;
    reg.test( 'kid is kid' ); // false
    reg.test( 'kid is \6' );  // true
    

9. String对正则表达式的支持

  • search

    查找字符串中是否有匹配正则的字符串,有则返回字符串第一次出现时的位置,无则返回null ( 正则中无论是否有全局匹配都不会影响返回结果 )

    var str = 'hello world hello';
    var reg = /hello/;
    var reg2 = /hello/g;
    console.log(str.search(reg)); //返回 0
    console.log(str.search(reg2));//返回 0
    
  • match

    匹配字符串中符合正则表达式的字符串,并返回该字符串的一个数组,其中包括字符串内容位置

    如果正则设置全局匹配,则一次性返回所有符合正则表达式的字符串数组

    如果其中添加了分组,返回符合要求的字符串以及分组的一个数组,但如果同时开启全局匹配则不会在数组中添加分组内容

    var str = 'hello world hello';
    var reg1 = /hello/;
    var reg2 = /hello/g;
    var reg3 = /(he)llo/;
    var reg4 = /(he)llo/g;
    // 匹配字符串中符合正则表达式的字符串,并返回该字符串的一个数组,其中包括字符串内容、位置
    // [ 'hello', index: 0, input: 'hello world hello', groups: undefined ]
    console.log(str.match(reg1));
    // 如果正则设置全局匹配,则一次性返回所有符合正则表达式的字符串数组
    // [ 'hello', 'hello' ]
    console.log(str.match(reg2));
    // 如果其中添加了分组,返回符合要求的字符串以及分组的一个数组
    // [
    //   'hello',
    //   'he',
    //   index: 0,
    //   input: 'hello world hello',
    //   groups: undefined
    // ]
    console.log(str.match(reg3));
    // 如果同时开启全局匹配则不会在数组中添加分组内容
    // [ 'hello', 'hello' ]
    console.log(str.match(reg4));
    
  • split

    // 以某种形式分割字符串 split()
    var str = "terry134HuA156lisi12zhangsan";
    // 当数字出现一次或多次时
    var reg = /\d+/;
    var result = str.split(reg);
    console.log(result); // [ 'terry', 'HuA', 'lisi', 'zhangsan' ]
    
  • replace

    // 满足正则表达式条件的内容将被替换
    var str = 'javascript'
    // 如果开启全局模式 则替换所有满足条件的字符
    var reg = /javascript/;
    // replace(正则表达式, 要替换的内容)
    var result = str.replace(reg, 'java');
    console.log(result); //java
    console.log(str); //javascript
    
  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值