正则表达式 RegExp

最新推荐文章于 2023-04-07 20:21:56 发布

柠檬柚子1104

最新推荐文章于 2023-04-07 20:21:56 发布

阅读量175

点赞数 1

分类专栏：前端正则表达式文章标签：正则表达式

本文链接：https://blog.csdn.net/michelledai1104/article/details/119864193

版权

前端同时被 2 个专栏收录

22 篇文章 0 订阅

订阅专栏

正则表达式

1 篇文章 0 订阅

订阅专栏

正则

正则表达式，又名 “规则表达式”
JS 中的数据类型, 是一个复杂数据类型
由我们自己来书写 “规则”，专门用来检测 字符串 是否符合 “规则” 使用的
我们使用一些特殊的字符或者符号定义一个 “规则公式”，然后用我们定义好的 “规则公式” 去检测字符串是不是合格
```
var reg = /\d+/
var str1 = '123'
var str2 = 'abc'
console.log(reg.test(str1)) // true
console.log(reg.test(str2)) // false
```
- 上面的变量 reg 就是定制好的规则
- 检测 str1 这个字符串的时候，符合规则
- 检测 str2 这个字符串的时候，不符合规则

创建一个正则表达式

想制定 “规则”，必须要按照人家要求的方式来制定
把一些字母和符号写在 // 中间的东西，叫做正则表达式，比如 /abcdefg/
创建正则表达式有两个方式 字面量 和 构造函数创建

字面量创建

// 下面就是字面量创建一个正则表达式
var reg = /abcdefg/

这个正则表达式就可以去检测字符串了

构造函数创建

// 下面就是构造函数创建一个正则表达式
var reg = new RegExp('abcdefg')
console.log(reg) //  /abcdefg/

使用构造函数方式创建的和字面量创建的，得到的结果一样

两种创建正则表达式的区别 *****

语法不一样
书写标识符的时候
=> 字面量方式直接书写在正则的后面
=> 内置构造函数, 以第二个参数的方式传递
拼接字符串
=> 字面量方式不接受拼接字符串
=> 内置构造函数方式, 可以拼接字符串
基本元字符书写
=> 字面量方式的时候, 直接书写 \s\d\w
=> 内置构造函数书写的时候, 需要书写 \s\d\w

为什么内置构造函数需要书写双斜线

字符串
=> 被引号包裹的所有内容叫做字符串
=> 当你在字符串内书写斜线() 的时候, 是表示转义符号
=> 会把紧挨着他的一个内容转换
-> 如果是有意义的内容转换成没有意义的内容
-> 如果是没有意义的内容转换成有意义的内容
-> 例子: n 是一个没有意义的字母
+ 当 n 和转义符在一起的时候, 就表示换行
new RegExp()
=> 第一个参数需要一个字符串
=> 你写的字符串就是正则内部的内容
=> 如果你想得到 /\s\d\w/
=> 那么你要给他的字符串里面写上 \s\d\w
=> 但是, 因为在字符串中 \ 是转义符
=> 当你书写字符串 ‘\s’ 的时候, \ 就会把 s 转换成有意义的特殊内容
-> 可以字符串中确实没有 \s 组成的特殊意义字符, 所以就变成了一个单独的字母 s
解决问题:
=> 使用 \ 把有意义的特殊字符 \ 转换成没有意义的文本
=> 当你书写 ‘\s\d\w’ 的时候, 实际字符串就是 ‘\s\d\w’

正则表达式里面的符号

知道了怎么创建一个正则表达式以后，我们就来详细的说一下正则表达式里面涉及到的一些符号了

元字符

. ：匹配非换行的任意字符
\ ：转译符号，把有意义的符号转换成没有意义的字符，把没有意义的字符转换成有意义的符号
\s ：匹配空白字符（空格/制表符/…）
\S ：匹配非空白字符
\d ：匹配数字
\D ：匹配非数字
\w ：匹配数字字母下划线
\W ：匹配非数字字母下划线

有了元字符我们就可以简单的制定一些规则了

var reg = /\s/
var str = 'a b'
var str2 = 'ab'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // false

var reg = /\d/
var str = 'abc1'
var str2 = 'abc'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // false

var reg = /\w/
var str = 'a1'
var str2 = '#@$'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // false

限定符

* ：前一个内容重复至少 0 次，也就是可以出现 0 ～正无穷 次
+ ：前一个内容重复至少 1 次，也就是可以出现 1 ～正无穷 次
? ：前一个内容重复 0 或者 1 次，也就是可以出现 0 ～ 1 次
{n} ：前一个内容重复 n 次，也就是必须出现 n 次
{n,} ：前一个内容至少出现 n 次，也就是出现 n ～正无穷 次
{n,m} ：前一个内容至少出现 n 次至多出现 m 次，也就是出现 n ～ m 次
限定符是配合元字符使用的

  // 下面正则表示验证数字出现 0 ～ 正无穷次都可以
  var reg = /\d*/
  var str = 'abc'
  var str2 = 'abc1'
  var str3 = 'abc123'
  console.log(reg.test(str)) // true
  console.log(reg.test(str2)) // true
  console.log(reg.test(str3)) // true

  // 下面正则表示验证数字出现 1 ～ 正无穷次都可以
  var reg = /\d+/
  var str = 'abc'
  var str2 = 'abc1'
  var str3 = 'abc123'
  console.log(reg.test(str)) // false
  console.log(reg.test(str2)) // true
  console.log(reg.test(str3)) // true

// 下面正则表示验证数字出现 0 ~ 1 次都可以
var reg = /\d?/
var str = 'abc'
var str2 = 'abc1'
console.log(reg.test(str)) // true
console.log(reg.test(str2)) // true

// 下面正则表示验证数字必须出现 3 次
var reg = /\d{3}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
console.log(reg.test(str))
 // falseconsole.log(reg.test(str2)) 
 // falseconsole.log(reg.test(str3)) // true

// 下面正则表示验证数字出现 3 ～ 正无穷次
var reg = /\d{3,}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abcd1234567'
console.log(reg.test(str))
 // falseconsole.log(reg.test(str2)) 
 // falseconsole.log(reg.test(str3)) 
 // trueconsole.log(reg.test(str4)) // true

// 下面正则表示验证数字只能出现 3 ～ 5 次
var reg = /\d{3,5}/
var str = 'abc'
var str2 = 'abc1'
var str3 = 'abc123'
var str4 = 'abc12345'
console.log(reg.test(str)) 
// falseconsole.log(reg.test(str2)) 
// falseconsole.log(reg.test(str3)) 
// trueconsole.log(reg.test(str4)) // true

边界符

^ ：表示开头
$ ：表示结尾
边界符是限定字符串的开始和结束的

// 下面表示从开头到结尾只能有数字，并且出现 3 ～ 5 次
var reg = /^\d{3,5}$/
var str = 'abc'
var str2 = 'abc123'
var str3 = '1'
var str4 = '1234567'
var str5 = '123'
var str6 = '12345'
console.log(reg.test(str)) // false
console.log(reg.test(str2)) // false
console.log(reg.test(str3)) // false
console.log(reg.test(str4)) // false
console.log(reg.test(str5)) // true
console.log(reg.test(str6)) // true

特殊符号

() ：限定一组元素
[] ：字符集合，表示写在 [] 里面的任意一个都行
[^] ：反字符集合，表示写在 [^] 里面之外的任意一个都行
- ：范围，比如 a-z 表示从字母 a 到字母 z 都可以
| ：或，正则里面的或 a|b 表示字母 a 或者 b 都可以

现在我们就可以把若干符号组合在一起使用了

// 下面是一个简单的邮箱验证// 非_$开头，任意字符出现至少6次，一个@符号，(163|126|qq|sina)中的任意一个，一个点，(com|cn|net)中的任意一个var reg = /^[^_$].{5,}@(163|126|qq|sina)\.(com|cn|net)$/

标识符

i ：表示忽略大小写
- 这个 i 是写在正则的最后面的
- /\w/i
- 就是在正则匹配的时候不去区分大小写
g ：表示全局匹配
- 这个 g 是写在正则的最后面的
- /\w/g
- 就是全局匹配字母数字下划线

正则表达式的方法

正则提供了一些方法给我们使用
用来检测和捕获字符串中的内容的

test

test 是用来检测字符串是否符合我们正则的标准
语法： 正则.test(字符串)

返回值： boolean

console.log(/\d+/.test('123')) // true
console.log(/\d+/.test('abc')) // false

exec

exec 是把字符串中符合条件的内容捕获出来
语法： 正则.exec(字符串)

返回值：把字符串中符合正则要求的第一项以及一些其他信息，以数组的形式返回

var reg = /\d{3}/
var str = 'hello123world456你好789'
var res = reg.exec(str)
console.log(res)
/*	["123", index: 5, input: "hello123world456你好789", groups: undefined]    0: "123"    groups: undefined    index: 5    input: "hello123world456你好789"    length: 1  	__proto__: Array(0)*/

数组第 0 项就是匹配到的字符串内容
index 属性表示从字符串的索引几开始是匹配的到字符串

exec() 捕获

=> 语法: 正则.exec(字符串)
=> 作用: 从字符串中把满足正则条件的部分获取出来
=> 返回值:
-> 原始字符串中没有符合正则要求的字符串片段
+ null
-> 原始字符串中有符合正则要求的片段
+ 正则没有 () 也没有全局标识符g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 不管捕获多少次, 每次都是从原始字符串的索引 0 开始检索
+ 正则有全局标识符 g
+ 返回值是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 注意: 第二次捕获是从第一次的结束位置开始向后查询, 直到最后捕获不到为止, 再下一次的时候, 又从字符串的索引0 开始检索
+ 有 ()
+ 返回的是一个数组
+ 索引 0 是从字符串中捕获出来的满足正则条件的第一个内容
+ 从索引 1 开始, 依次是每一个小括号的单独内容
+ 注意: 按照小括号的开始标志, 来数是第几个小括号

  扩展:
    + () 有两个意义
      => 一个整体
      => 单独捕获
    + 如果你想只使用一个意义, 整体的所用, 不想在捕获的时候单独捕获出来
      => 你可以写成 (?:)
      => 匹配但不捕获

字符串的方法

字符串中有一些方法也是可以和正则一起使用的

search

search 是查找字符串中是否有满足正则条件的内容
语法： 字符串.search(正则)

返回值：有的话返回开始索引，没有返回 -1

var reg = /\d{3}/
var str = 'hello123'
var str2 = 'hello'
console.log(str.search(reg)) // 5
console.log(str2.search(reg)) // -1

match

match 找到字符串中符合正则条件的内容返回
语法： 字符串.match(正则)

返回值：

没有标示符 g 的时候，是和 exec 方法一样
有标示符 g 的时候，是返回一个数组，里面是匹配到的每一项

var reg = /\d{3}/
var str = 'hello123world456'
var str2 = 'hello'
console.log(str.match(reg)) // ["123", index: 5, input: "hello123wor456", groups: undefined]
console.log(str2.match(reg)) // null

var reg = /\d{3}/g
var str = 'hello123world456'
var str2 = 'hello'
console.log(str.match(reg)) // ["123", "456"]
console.log(str2.match(reg)) // null

正则的两个特性

懒惰性
=> 每一次捕获都是从原始字符串的索引 0 位置开始检索
=> 解决: 使用全局标识符 g
贪婪性
=> 贪婪匹配: 能拿多少拿多少尽可能多的匹配内容
=> 非贪婪匹配: 能拿多少拿多少尽可能少的匹配内容
-> 需要使用非贪婪限定符
-> 在原先的限定符后面再写一个 ?
-> *? 0 ~ 多次, 但是 0 次能解决问题, 就不在多
-> +? 1 ~ 多次, 但是 1 次能解决问题, 就不在多
-> ?? 0 ~ 1次, 0 次能解决问题, 就不去管 1 次
-> {n,}?
-> {n,m}?

replace

replace 是将字符串中满足正则条件的字符串替换掉
语法： 字符串.replace(正则，要替换的字符串)

返回值：替换后的字符串

var reg = /\d{3}/
var str = 'hello123world456'
var str2 = 'hello'
console.log(str.replace(reg)) // hello666world456
console.log(str2.replace(reg)) // hello

var reg = /\d{3}/g
var str = 'hello123world456'
var str2 = 'hello'
console.log(str.replace(reg)) // hello666world666
console.log(str2.replace(reg)) // hello

柠檬柚子1104

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式 RegExp

正则正则表达式，又名 “规则表达式”JS 中的数据类型, 是一个复杂数据类型由我们自己来书写 “规则”，专门用来检测字符串是否符合 “规则” 使用的我们使用一些特殊的字符或者符号定义一个 “规则公式”，然后用我们定义好的 “规则公式” 去检测字符串是不是合格var reg = /\d+/var str1 = '123'var str2 = 'abc'console.log(reg.test(str1)) // trueconsole.log(reg.test(str2)
复制链接

扫一扫