正则表达式 RegExp

正则

  • 正则表达式,又名 “规则表达式”

  • JS 中的数据类型, 是一个复杂数据类型

  • 由我们自己来书写 “规则”,专门用来检测 字符串 是否符合 “规则” 使用的

  • 我们使用一些特殊的字符或者符号定义一个 “规则公式”,然后用我们定义好的 “规则公式” 去检测字符串是不是合格

    var reg = /\d+/
    var str1 = '123'
    var str2 = 'abc'
    console.log(reg.test(str1)) // true
    console.log(reg.test(str2)) // false
    
    • 上面的变量 reg 就是定制好的规则
    • 检测 str1 这个字符串的时候,符合规则
    • 检测 str2 这个字符串的时候,不符合规则

创建一个正则表达式

  • 想制定 “规则”,必须要按照人家要求的方式来制定
  • 把一些字母和符号写在 // 中间的东西,叫做正则表达式,比如 /abcdefg/
  • 创建正则表达式有两个方式 字面量构造函数创建

字面量创建

// 下面就是字面量创建一个正则表达式
var reg = /abcdefg/
  • 这个正则表达式就可以去检测字符串了

构造函数创建

// 下面就是构造函数创建一个正则表达式
var reg = new RegExp('abcdefg')
console.log(reg) //  /abcdefg/
  • 使用构造函数方式创建的和字面量创建的,得到的结果一样

两种创建正则表达式的区别 *****

  1. 语法不一样
  2. 书写标识符的时候
    => 字面量方式直接书写在正则的后面
    => 内置构造函数, 以第二个参数的方式传递
  3. 拼接字符串
    => 字面量方式不接受拼接字符串
    => 内置构造函数方式, 可以拼接字符串
  4. 基本元字符书写
    => 字面量方式的时候, 直接书写 \s\d\w
    => 内置构造函数书写的时候, 需要书写 \s\d\w

为什么内置构造函数需要书写双斜线

  • 字符串
    => 被引号包裹的所有内容叫做字符串
    => 当你在字符串内书写 斜线() 的时候, 是表示转义符号
    => 会把紧挨着他的一个内容转换
    -> 如果是有意义的内容转换成没有意义的内容
    -> 如果是没有意义的内容转换成有意义的内容
    -> 例子: n 是一个没有意义的字母
    + 当 n 和 转义符 在一起的时候, 就表示 换行
  • new RegExp()
    => 第一个参数需要一个字符串
    => 你写的字符串就是正则内部的内容
    => 如果你想得到 /\s\d\w/
    => 那么你要给他的字符串里面写上 \s\d\w
    => 但是, 因为在字符串中 \ 是转义符
    => 当你书写字符串 ‘\s’ 的时候, \ 就会把 s 转换成有意义的特殊内容
    -> 可以字符串中确实没有 \s 组成的特殊意义字符, 所以就变成了一个 单独的 字母 s
  • 解决问题:
    => 使用 \ 把有意义的特殊字符 \ 转换成没有意义的文本
    => 当你书写 ‘\s\d\w’ 的时候, 实际字符串就是 ‘\s\d\w’

正则表达式里面的符号

  • 知道了怎么创建一个正则表达式以后,我们就来详细的说一下正则表达式里面涉及到的一些符号了

元字符

  • . : 匹配非换行的任意字符

  • \ : 转译符号,把有意义的 符号 转换成没有意义的 字符,把没有意义的 字符 转换成有意义的 符号

  • \s : 匹配空白字符(空格/制表符/…)

  • \S : 匹配非空白字符

  • \d : 匹配数字

  • \D : 匹配非数字

  • \w : 匹配数字字母下划线

  • \W : 匹配非数字字母下划线

  • 有了元字符我们就可以简单的制定一些规则了

    var reg = /\s/
    var str = 'a b'
    var str2 = 'ab'
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false
    
    var reg = /\d/
    var str = 'abc1'
    var str2 = 'abc'
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false
    
    var reg = /\w/
    var str = 'a1'
    var str2 = '#@$'
    console.log(reg.test(str)) // true
    console.log(reg.test(str2)) // false
    

限定符

  • * : 前一个内容重复至少 0 次,也就是可以出现 0 ~ 正无穷

  • + : 前一个内容重复至少 1 次,也就是可以出现 1 ~ 正无穷

  • ? : 前一个内容重复 0 或者 1 次,也就是可以出现 0 ~ 1

  • {n} : 前一个内容重复 n 次,也就是必须出现 n

  • {n,} : 前一个内容至少出现 n 次,也就是出现 n ~ 正无穷

  • {n,m} : 前一个内容至少出现 n 次至多出现 m 次,也就是出现 n ~ m

  • 限定符是配合元字符使用的

  // 下面正则表示验证数字出现 0 ~ 正无穷次都可以
  var reg = /\d*/
  var str = 'abc'
  var str2 = 'abc1'
  var str3 = 'abc123'
  console.log(reg.test(str)) // true
  console.log(reg.test(str2)) // true
  console.log(reg.test(str3)) // true
  // 下面正则表示验证数字出现 1 ~ 正无穷次都可以
  var reg = /\d+/
  var str = 'abc'
  var str2 = 'abc1'
  var str3 = 'abc123'
  console.log(reg.test(str)) // false
  console.log(reg.test(str2)) // true
  console.log(reg.test(str3)) // true
// 下面正则表示验证数字出现 0 ~ 1 次都可以
var reg = /\d?/
var str = 'abc'
var str2 = 'abc1'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // true
// 下面正则表示验证数字必须出现 3 次
var reg = /\d{3}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
console.log(reg.test(str))
 // falseconsole.log(reg.test(str2)) 
 // falseconsole.log(reg.test(str3)) // true
// 下面正则表示验证数字出现 3 ~ 正无穷次
var reg = /\d{3,}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abcd1234567'
console.log(reg.test(str))
 // falseconsole.log(reg.test(str2)) 
 // falseconsole.log(reg.test(str3)) 
 // trueconsole.log(reg.test(str4)) // true
// 下面正则表示验证数字只能出现 3 ~ 5 次
var reg = /\d{3,5}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abc12345'
console.log(reg.test(str)) 
// falseconsole.log(reg.test(str2)) 
// falseconsole.log(reg.test(str3)) 
// trueconsole.log(reg.test(str4)) // true

边界符

  • ^ : 表示开头

  • $ : 表示结尾

  • 边界符是限定字符串的开始和结束的

// 下面表示从开头到结尾只能有数字,并且出现 3 ~ 5 次
var reg = /^\d{3,5}$/
var str = 'abc'
var str2 = 'abc123'
var str3 = '1'
var str4 = '1234567'
var str5 = '123'
var str6 = '12345'
console.log(reg.test(str)) // false
console.log(reg.test(str2)) // false
console.log(reg.test(str3)) // false
console.log(reg.test(str4)) // false
console.log(reg.test(str5)) // true
console.log(reg.test(str6)) // true

特殊符号

  • () : 限定一组元素

  • [] : 字符集合,表示写在 [] 里面的任意一个都行

  • [^] : 反字符集合,表示写在 [^] 里面之外的任意一个都行

  • - : 范围,比如 a-z 表示从字母 a 到字母 z 都可以

  • | : 或,正则里面的或 a|b 表示字母 a 或者 b 都可以

  • 现在我们就可以把若干符号组合在一起使用了

    // 下面是一个简单的邮箱验证// 非_$开头,任意字符出现至少6次,一个@符号,(163|126|qq|sina)中的任意一个,一个点,(com|cn|net)中的任意一个var reg = /^[^_$].{5,}@(163|126|qq|sina)\.(com|cn|net)$/
    

标识符

  • i : 表示忽略大小写
    • 这个 i 是写在正则的最后面的
    • /\w/i
    • 就是在正则匹配的时候不去区分大小写
  • g : 表示全局匹配
    • 这个 g 是写在正则的最后面的
    • /\w/g
    • 就是全局匹配字母数字下划线

正则表达式的方法

  • 正则提供了一些方法给我们使用
  • 用来检测和捕获字符串中的内容的

test

  • test 是用来检测字符串是否符合我们正则的标准

  • 语法: 正则.test(字符串)

  • 返回值: boolean

    console.log(/\d+/.test('123')) // true
    console.log(/\d+/.test('abc')) // false
    

exec

  • exec 是把字符串中符合条件的内容捕获出来

  • 语法: 正则.exec(字符串)

  • 返回值: 把字符串中符合正则要求的第一项以及一些其他信息,以数组的形式返回

    var reg = /\d{3}/
    var str = 'hello123world456你好789'
    var res = reg.exec(str)
    console.log(res)
    /*	["123", index: 5, input: "hello123world456你好789", groups: undefined]    0: "123"    groups: undefined    index: 5    input: "hello123world456你好789"    length: 1  	__proto__: Array(0)*/
    
    • 数组第 0 项就是匹配到的字符串内容
    • index 属性表示从字符串的索引几开始是匹配的到字符串

exec() 捕获

=> 语法: 正则.exec(字符串)
=> 作用: 从 字符串中 把满足正则条件的部分获取出来
=> 返回值:
-> 原始字符串中没有符合正则要求的字符串片段
+ null
-> 原始字符串中有符合正则要求的片段
+ 正则没有 () 也没有 全局标识符g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 不管捕获多少次, 每次都是从原始字符串的索引 0 开始检索
+ 正则有全局标识符 g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 第二次捕获是从第一次的结束位置开始向后查询, 直到最后捕获不到为止, 再下一次的时候, 又从字符串的 索引0 开始检索
+ 有 ()
+ 返回的是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 从索引 1 开始, 依次是每一个小括号的单独内容
+ 注意: 按照小括号的开始标志, 来数是第几个小括号

  扩展:
    + () 有两个意义
      => 一个整体
      => 单独捕获
    + 如果你想只使用一个意义, 整体的所用, 不想在捕获的时候单独捕获出来
      => 你可以写成 (?:)
      => 匹配但不捕获

字符串的方法

  • 字符串中有一些方法也是可以和正则一起使用的

search

  • search 是查找字符串中是否有满足正则条件的内容

  • 语法: 字符串.search(正则)

  • 返回值 : 有的话返回开始索引,没有返回 -1

    var reg = /\d{3}/
    var str = 'hello123'
    var str2 = 'hello'
    console.log(str.search(reg)) // 5
    console.log(str2.search(reg)) // -1
    

match

  • match 找到字符串中符合正则条件的内容返回

  • 语法: 字符串.match(正则)

  • 返回值 :

    • 没有标示符 g 的时候,是和 exec 方法一样
    • 有标示符 g 的时候,是返回一个数组,里面是匹配到的每一项
    var reg = /\d{3}/
    var str = 'hello123world456'
    var str2 = 'hello'
    console.log(str.match(reg)) // ["123", index: 5, input: "hello123wor456", groups: undefined]
    console.log(str2.match(reg)) // null
    
    var reg = /\d{3}/g
    var str = 'hello123world456'
    var str2 = 'hello'
    console.log(str.match(reg)) // ["123", "456"]
    console.log(str2.match(reg)) // null
    

正则的两个特性

  1. 懒惰性
    => 每一次捕获都是从原始字符串的索引 0 位置开始检索
    => 解决: 使用全局标识符 g

  2. 贪婪性
    => 贪婪匹配: 能拿多少拿多少 尽可能多的匹配内容
    => 非贪婪匹配: 能拿多少拿多少 尽可能少的匹配内容
    -> 需要使用非贪婪限定符
    -> 在原先的限定符后面再写一个 ?
    -> *? 0 ~ 多次, 但是 0 次能解决问题, 就不在多
    -> +? 1 ~ 多次, 但是 1 次能解决问题, 就不在多
    -> ?? 0 ~ 1次, 0 次能解决问题, 就不去管 1 次
    -> {n,}?
    -> {n,m}?

replace

  • replace 是将字符串中满足正则条件的字符串替换掉

  • 语法: 字符串.replace(正则,要替换的字符串)

  • 返回值 : 替换后的字符串

    var reg = /\d{3}/
    var str = 'hello123world456'
    var str2 = 'hello'
    console.log(str.replace(reg)) // hello666world456
    console.log(str2.replace(reg)) // hello
    
    var reg = /\d{3}/g
    var str = 'hello123world456'
    var str2 = 'hello'
    console.log(str.replace(reg)) // hello666world666
    console.log(str2.replace(reg)) // hello
    
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值