一、组成
正则表达式主要由两部分组成:模式 + 修饰符
const re1 = new RegExp("hello", "i")
const re2 = /hello/i
二、正则表达式的使用方式
1、RegExp 的实例方法
- exec:一个在字符串中执行查找匹配的RegExp 方法,它返回一个数组(为匹配到则返回null)
- test:一个在字符串中测试是否匹配的RegExp 方法,它返回true 或 false
2、字符串的方法
- match:一个在字符串中执行查找匹配的String 方法,它返回一个数组,在未匹配到时会返回null
- matchAll:一个在字符串中执行查找所有匹配的String 方法,它返回一个迭代器
- search:一个在字符串中测试匹配的String 方法,并且使用替换字符串替换掉匹配到的子字符串
- replace:一个在字符串中执行查找匹配的String 方法,并且使用替换字符串换掉匹配到的子字符串
- split:一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分割后的子字符串存储到数组中的String 方法
三、修饰符
i:忽略大小写(ignore)
g:全局匹配(global)
m:多行匹配(multiple)
四、规则
1、字符类
- \d:(digit)数字:从0到9 的字符
- \s:(space)空格符号。包括空格、制表符\t、换行符\n 和其他少数稀有字符;如:\v、\f和\r
- \w:(word)“单字”字符,拉丁字母或数字或下划线_
- . :(点). 时一种特殊的字符类,它可以匹配除换行符之外的任何字符
2、反向类
- \D:非数字;除\d 以外的任何字符
- \S:非空格字符;除\s 以外的任何字符
- \W:非单字字符;除\w 以外的任何字符
3、锚点
- ^:以...开头
- $:以...结尾
// 以hello 开头
/^hello/.test('hello world') // true
// 以world 结尾
/world$/.test('hello world') // true
- \b:词边界
/\bworld\b/.test('hello world!!!') // true
4、转义字符
将特殊字符前面加一个反斜杠,便可以转换为常规字符来使用
常见的转义字符:[ ] \ / ^ $ . | ? * + ( )
5、集合与范围
1、集合:
[0123456789]:表示匹配中括号中的任意一个
2、范围:
[0-9]:等同于[0123456789],表示匹配中括号中的任意一个
[a-z]:表示匹配任意一个小写字母
[a-zA-Z]:表示匹配任意一个字母
\d:等同于[0-9]
\w:等同于[a-zA-Z0-9_]
3、排除范围
\d:等同于[0-9],表示匹配任意一个数字
\D:等同于[^0-9],表示匹配除0-9 以外的任何字符
6、量词
{n}:表示匹配n个
{n,m}:表示匹配n到m个
+:表示匹配一个或多个,相当于{1,}
?:表示匹配零个或一个,相当于{0,1},即:该符号可选
*:表示匹配零个或多个,相当于{0,},即:该符号可以多次出现或不出现
7、贪婪模式和惰性模式
在量词后面加一个?,表示惰性模式
const message = '<div>和<html>'
// 贪婪模式
const re1 = /<.+>/ig
const result1 = message.match(re1) // ['<div>和<html>']
// 惰性模式
const re2 = /<.+?>/ig
const result2 = message.match(re2) // ['<div>', '<html>']
8、捕获组
1、() 的两个作用:
- 将匹配的一部分作为结果数组中的单独项
- 将括号视为一个整体
const message = '<div>和<html>'
const res = /<(.+)>/ig
const iterator = message.metchAll(res)
for(const item of iterator) {
console.log(item[1])
// div
// html
}
const str = "<h2>title</h2>"
const result = str.match(/<(.+?)>/)
console.log(result[0]) // <h2>
console.log(result[1]) // h2
2、或
匹配一个或两个abc 或cba 或nba
/(abc|cba|nba){1,2}/