介绍
正则表达式(RegularExpression)是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象
通常用来查找、替换那些符合正则表达式的文本,许多语言都支持正则表达式。
通俗理解一下:
请在人群中找出【戴帽子和眼镜的男人】
戴帽子、戴眼镜、男人都是描述信息,通过这些信息能够在人群中查找到确定的某个人,那么这些用于查找的描息编写一个模式,对应到计算机中就是所谓的正则表达式。
正则表达式在JavaScript中的使用场景:
- 例如验证表单:用户名表单只能输入英文字母、数字或者下划线,昵称输入框中可以输入中文(匹配) 比如用户名:/^[a-z0-9_-][3,16}$/
- 过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等。
总结:
- 1.正则表达式是用于匹配字符串中字符组合的模式
- 2.正则表达式有什么作用?
- 表单验证(匹配)
- 过滤敏感词(替换)
- 字符串中提取我们想要的部分(提取)
语法
我们分为两步:
- 定义规则
- 查找
比如:查找下面文本中是否包含字符串'前端'
let str='加油努力,学好前端'
定义规则语法:
const变量名=/表达式/
其中/ /是正则表达式字面量
比如:
const reg = /前端/
判断是否有符合规则的字符串:
test()方法
用来查看正则表达式与指定的字符串是否匹配
语法:
reg0bj.test(被检测的字符串)
比如:
//要检测的字符串
const str='加油努力,学好前端'
//1.定义正则表达式,检测规则
const reg=/前端/
///2.检测方法
console.log(reg.test(str)) // true
如果正则表达式与指定的字符串匹配,返回true,否则false
3.检索(查找)符合规则的字符串:
exec()方法
在一个指定字符串中执行一个搜索匹配
语法:
reg0bj.exec(被检测字符串)
比如:
//要检测的字符串conststr='加油努力,学好前端'
//1.定义正则表达式,检测规则
const reg=/前端/
//2.检测方法
console.log(reg.exec(str)) //返回的是数组
如果匹配成功,exec()方法返回一个数组,否则返回null
两种方法的区别
test方法用于判断是否有符合规则的字符串,返回的是布尔值找到返回true,否则false
exec方法用于检索(查找)符合规则的字符串,找到返回数组,否则为null
元字符
- 普通字符:
大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字。也就是说普通字符只能够匹配字符串中与它们相同的字符。
- 元字符(特殊字符)
是一些具有特殊含义的字符,可以极大提高了灵活性和强大的匹配功能。
- 比如,规定用户只能输入英文26个英文字母,普通字符的话abcdefghijklm.....
- 但是换成元字符写法:[a-z]
为了方便记忆和学习,我们对众多的元字符进行了分类:
边界符
(表示位置,开头和结尾,必须用什么开头,用什么结尾)
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
边界符 | 说明 |
^ | 表示匹配行首的文本(以谁开始) |
$ | 表示匹配行尾的文本(以谁结束) |
如果^和$在一起,表示必须是精确匹配。
例如:
console.log(/哈/.test('哈'))//true
console.log(/二哈/.test('二哈'))//true
console.log(/二哈/.test('很二哈哈'))//true
//^开头
console.log(/^二哈/.test('很二哈哈'))//false
console.log(/^二哈/.test('二哈很傻'))//true
//$结尾
console.log(/^二哈$/.test('二哈很傻'))//false
console.log(/^二哈$/.test('二哈二哈'))//false
console.log(/^二哈$/.test('二哈'))//true
量词
(表示重复次数)
量词用来设定某个模式出现的次数
量词 | 说明 |
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,} | 重复n次或更多次 |
{n,m} | 重复n到m次 |
注意:逗号两端一定不能出现空格
下面这种便于理解:
- +表示重复至少1次
- ?表示重复0次或1次
- *表示重复0次或多次
- {m,n}表示复m到n次
字符类
(比如\d表示0~9)
(1)[ ]匹配字符集合
后面的字符串只要包含abc中任意一个字符,都返回true。
//只要中括号里面的任意字符出现都返回true
console.log(/[abc]/.test('andy'))//true
console.log(/[abc]/.test('baby'))//true
console.log(/[abc]/.test('cry'))//true
console.log(/[abc]/.test('die'))//false
(1)[ ]里面加上-连字符
使用连字符-表示一个范围
console.log(/^[a-z]$/.test('c'))//true
比如:
- [a-z]表示a到z26个英文字母都可以
- [a-zA-Z]表示大小写都可以
- [0-9]表示0~9的数字都可以
认识下:
^[1-9]:表示第一位数字再0-9之间。
[0-9]{4, }:表示后四位数在0-9之间,{4,}表示四位数的范围在离他最近的[ ]之内。
腾讯QQ号:^[1-9][0-9]{4,}$
//(腾讯QQ号从10000开始)
(1)[ ]里面加上^取反符号
比如:
- [^a-z]匹配除了小写字母以外的字符
- 注意要写到中括号里面
(2).匹配除换行符之外的任何单个字符
(3)预定义:指的是某些常见模式的简写方式。
预定类 | 说明 |
\d | 匹配0-9之间的任一数字,相当于[^0-9] |
\D | 匹配所有0-9以外的字符,相当于[^0-9] |
\w | 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9_] |
\W | 除所有字母、数字和下划线以外的字符,相当于[^A-Za-z0-9_] |
\s | 匹配空格(包括换行符、制表符、空格符等),相等于[\t\r\n\v\f] |
\S | 匹配非空格的字符,相当于[^\t\r\n\v\f] |
日期格式:
^\d{4}-\d{1,2}-\d{1,2}
//2024-6-10
修饰符
修饰符约束正则执行的某些细节行为,如是否区分大小写、是否支持多行匹配等
语法:
/表达式/修饰符
- i是单词ignore的缩写,正则匹配时字母不区分大小写
- g是单词global的缩写,匹配所有满足正则表达式的结果
console.log(/a/i.test('a'))//true
console.log(/a/i.test('A'))//true
替换 replace替换
语法:
字符串.replace(/正则表达式/,‘替换的文本')