JavaScript中的正则表达式

正则表达式形象化网站:https://regexper.com/
一、RegExp对象
JavaScript通过内置对象RegExp支持正则表达式
有两种方法支持实例化RegExp对象

  • 字面量
    例如:var reg = /\bis\b/g;(这里的 \b 代表单词边界)

  • 构造函数
    例如:var reg = new RegExp(’\bis\b’,‘g’);
    (修饰符:1.g:global 全文搜索,不添加,搜索到第一个就匹配停止
    2.i:ignore case 忽略大小写,默认大小写敏感
    3.m:multiline,可以进行多行匹配,但是只有使用^和$模式时才起作用,在其他模式中,加不加入m都可以进行多行匹配)
    二、元字符
    正则表达式由两种基本字符类型组成

  • 原义文本字符

  • 元字符(在正则表达式中有特殊含义的非字母字符,例如:* + ? $ ^ . | \ () {} [] 等)

    三、字符类
    我们可以使用元字符 [] 来构建一个简单的类。所谓类是指某些特性的对象,一个泛指,而不是某个字符。表达式 [abc]abc 归为一类,表达式可以匹配这类的字符。
    字符类取反:使用元字符 k 创建 反向类/负向类(指不属于某类的内容),表达式 [^abc] 表示不是字符 a 或 b 或 c 的内容。
    四、范围类
    我们可以使用 [a-z] 来连接两个字符表示从 az 的任意字符,这是个闭区间,也包含 az 本身。在 [] 组成的类内部是可以连写的 [a-zA-Z]
    五、预定义类及边界
    正则表达式提供 预定义类 来匹配常见的字符类
    在这里插入图片描述
    例如:匹配一个 ab+数字+任意字符 的字符串 ab\d. (不用预定义类: ab[0-9][^\r\n])
    正则表达式还提供了几个常用的边界匹配字符
    在这里插入图片描述
    例如:’@123@abc@’.replace(/@./g,‘Q’) → Q23Qbc@
    ‘@123@abc@’.replace(/^@./g,‘Q’) → Q23@abc@
    ‘@123@abc@’.replace(/.@/g,‘Q’) → @12QabQ
    ‘@123@abc@’.replace(/.@$/g,‘Q’) → @123@abQ
    六、量词
    在这里插入图片描述
    例如:\d{20} 匹配一个出现20次数字的字符串
    七、JS正则贪婪模式与非贪婪模式

  • 贪婪模式:正则表达式在匹配时会尽可能多的匹配
    例如:‘12345678’.repalce(/\d{3,6}/g,‘X’) → X78

  • 非贪婪模式:让正则表达式尽可能少的匹配,即一旦匹配成功就不再继续尝试匹配(做法很简单,在量词后加上即可)
    例如:‘123456789’.match(/\d{3,5}?/g) → [“123”,“456”,“789”]
    ‘12345678’.repalce(/\d{3,6}?/g,‘X’) → XX78
    八、分组

  • 使用 () 可以达到分组的功能,使量词作用于分组
    例如:匹配字符串 Byron 连续出现3次的场景 → (Byron){3}
    (Byron{3} → 表示匹配Byro和n为3次的场景)

  • 使用 | 可以达到或的效果
    例如:‘ByronCasper’,replace(/Byron|Casper/g,‘X’) → XX
    ‘ByronsperByrCasper’,replace(/Byr(on|Ca)sper/g,‘X’) → XX

  • 反向引用
    需求:2020-02-26 → 02/26/2020
    ‘2020-02-26’.replace(/(\d{4})-(\d{2})-(\d{2})/g,’$2/$3/$1’) → 02/26/2020

  • 忽略分组
    不希望捕获某些分组,只需要在分组内前面加上 ?: 就可以
    例如:(?:Byron).(ok) 这样就忽略掉 Byron 这个分组了
    九、前瞻

  • 正则表达式从文本头部向尾部开始解析,文本尾部方向,称为"前"

  • 前瞻就是在正则表达式匹配到规则的时候,向前检查是否符合断言,后顾/后瞻方向相反

  • JavaScript不支持后顾

  • 符合和不符合特定断言称为肯定/正向匹配和否定/负向匹配
    在这里插入图片描述
    例如:'a23’.replace(/\w(?=\d)/g,‘X’) → X23
    'a234v8’.replace(/\w(?=\d)/g,‘X’) → X2X4X8
    'a234vv’.replace(/\w(?=\d)/g,‘X’) → X2X4vv
    'a234vv’.replace(/\w(?!\d)/g,‘X’) → aX3XXX
    十、JS对象属性

  • global: 是否全文搜索,默认false

  • ignore case: 是否大小写敏感,默认false

  • multiline: 多行搜索,默认false

  • lastIndex: 是当前表达式匹配内容的最后一个字符的下一个位置

  • source: 正则表达式的文本字符串
    十一、正则表达式本身的test和exec方法(RegExp对象的方法)
    RegExp.portotype.test(str)
    用于测试字符串参数中是否存在匹配正则表达式模式的字符串,如果存在则返回 true ,否则返回 false
    例如:var reg2 = /\w/g;
    用reg2.test(‘a’)多次执行会得到 → true → false→ true → false。是由于全局匹配,会根据reg2 的lastIndex这样来匹配
    RegExp.portotype.exec(str)
    使用正则表达式模式对字符串执行搜索,并将更新全局RegExp对象的属性以反映匹配结果,如果没有匹配的文本则返回 null,否则返回一个结果数组:

  • index 声明匹配文本的第一个字符的位置

  • input 存放被检索的字符串 string
    — 非全局调用

    • 调用非全局的 RegExp 对象的 exec() 时,返回数组
    • 第一个元素是与正则表达式相匹配的文本
    • 第二个元素是与 RegExp 对象的第一个子表达式相匹配的文本(如果有的话)
    • 第三个元素是与 RegExp 对象的第二个子表达式相匹配的文本(如果有的话),以此类推

    — 全局调用
    例如:var reg4 = /\d(\w)(\w)\d/g;
    var ts = ‘$1az2bb3cy4dd5ee’;
    var ret = reg3.exec(ts);

while ( ret = reg4.exec(ts) ) {
console.log( reg4.lastIndex + ‘\t’ + ret.index + ‘\t’ + ret.toString());
}

“5 1 1az2,a,z”
“11 7 3cy4,c,y”

十二、字符串对象方法
String.portotype.search(reg)
search() 方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串,方法返回第一个匹配结果 index ,查找不到返回 -1。search() 方法不执行全局匹配,它将忽略标志 g ,并且总是从字符串的开始进行检索
String.portotype.match(reg)
match() 方法将检索字符串,以找到一个或多个与 regexp 匹配的文本
regexp 是否具有标志 g 对结果影响很大
1.非全局调用

  • 如果regexp 没有标志 g ,那么 match() 方法就只能在字符串中执行一次匹配
  • 如果没有找到任何文匹配的文本,将返回 null
  • 否则它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
  • 返回数组的第一个元素存放的时匹配文本,而其余的元素存放的是与正则表达式子表
    达式匹配的文本
  • 除了常规的数组元素之外,返回的数组还含有 2 个对象属性
  • index 声明匹配文本的起始字符在字符串中的位置
  • input 声明对 stringObject 的引用
    例如:var reg3 = /\d(\w)\d/;
    var ts = ‘$1a2b3c4d5e’;
    var ret = ts.match(reg3);
    console.log(ret); → [“1a2”,“a”]
    console.log(ret.index + ‘\t’ + reg3.lastIndex); → “1 0”

2.非全局调用

  • 如果regexp 具有标志 g ,那么 match() 方法将执行全局检索,找到字符串中的所有匹配子
    字符串
  • 如果没有找到任何文匹配的文本,将返回 null
  • 否则它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
  • 数组元素中存放的是字符串中所有的匹配子串,而且也没有index属性或input属性
    例如:var reg4 = /\d(\w)\d/g;
    var ts = ‘$1a2b3c4d5e’;
    var ret = ts.match(reg4);
    console.log(ret); → [“1a2”,“3c4”]
    console.log(ret.index + ‘\t’ + reg3.lastIndex); → “undefined 0”
    String.portotype.split(reg)
    我们经常使用 split() 方法把字符串分割成字符数组
    ‘a,b,c,d’.split(’,’); → [“a”,“b”,“c”,“d”]
    在一些复杂的分割情况下我们可以使用正则表达式解决
    ‘a1b2c3d’.split(/\d/); → [“a”,“b”,“c”,“d”]
    String.portotype.replace(reg)
    String.prototype.replace(str,replaceStr)
    String.prototype.replace(reg,replaceStr)
    String.prototype.replace(reg,function)
    function参数含义
    function会在每次匹配替换的时候调用,有四个参数
    1、匹配字符串
    2、正则表达式分组内容,没有分组则没有该参数
    3、匹配在字符串中的index
    4、原字符串
    例如:
    ‘a1b2c3d4e5’.replace(/\d/g,function(match,index,origin)){
    console.log(index);
    return parseInt(match) + 1;
    }

1 3 5 7 9 “a2b3c4d4e6”

‘a1b2c3d4e5’.replace(/(\d)(\w)(\d)/g,function(match,group1,group2,group3,index,origin)){
console.log(match);
return group1 + group3;
}

“1b2” “3d4” “a12c34e5”

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值