正则表达式
介绍
正则表达式(Regular Expression)是用于匹配字符串中字符组合的模式。在 JavaScript中,正则表达式也是对
象。通常用来查找、替换那些符合正则表达式的文本,许多语言都支持正则表达式。
正则表达式在 JavaScript中的使用场景:
-
例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)
- 比如用户名:
/^[a-z0-9_-]{3,16}$/
- 比如用户名:
-
过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 。
语法
- 先定规则
- 查找
定义正则表达式语法:
const 变量名 = /表达式/
- 其中/ /是正则表达式字面量
判断是否有符合规则的字符串 :
变量名.test(被检测的字符串)
- 变量名是规则,后面的是被检测的
- 如果正则表达式与指定的字符串匹配,返回true,否则false
检索符合规则的字符串 :
变量名.exec(被检测字符串)
- 如果匹配成功,exec()方法返回一个数组,否则返回null
元字符
普通字符
大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字。
即普通字符只能够匹配字符串中与它们相同的字符。
元字符(特殊字符)
是一些具有特殊含义的字符,可以极大提高了灵活性和强大的匹配功能。
-
比如,规定用户只能输入英文26个英文字母,普通字符的话 abcdefghijklm……
-
但是换成元字符写法: [a-z]
-
参考文档:
分类
边界符
表示位置,开头和结尾,必须用什么字符开始,用什么结尾。
用来提示字符所处的位置 :
边界符 | 说明 |
---|---|
^ | 表示匹配行首的文本(以谁开始) |
$ | 表示匹配行尾的文本(以谁结束) |
两个同时用可以做到精确匹配
量词
表示重复次数,用来设定某个模式出现的次数 。
量词 | 说明 |
---|---|
* | 重复0次或更多次(大于等于0) |
+ | 重复1次或更多次(大于等于1) |
? | 重复0次或1次 |
{n} | 重复n次 |
{n,} | 重复n次或者更多次(大于等于n) |
{n,m} | 重复n到m次 |
逗号左右两侧不能有空格
字符类
-
[]匹配字符集合
- 后面的字符串只要包含中括号里的任意一个字符,都返回true
/[abc]/.test('andy'); //true /^[abc]$/.test('ab'); //false,精确匹配,三个里面只能选一个用于开头和结尾 /^[abc]{2}$/.test('ab'); //true
-
[]里面加上-字符,表示一个范围
[a-z]
表示 a 到 z 26个英文字母都可以[a-zA-Z]
表示大小写都可以[0-9]
表示 0~9 的数字都可以[a-zA-Z0-9]
表示字母大小写和数字都可以
-
^[1-9][0-9]{4,}$ //从10000开始
-
[] 里面加上 ^ 取反符号
-
比如:
[^a-z]
匹配除了小写字母以外的字符 -
注意要写到中括号里面
-
-
.匹配除换行符之外的任何单个字符
-
预定义 :指某些常见模式的简写方式。
预定类 说明 \d 0~9之间的数字 \D 所有0~9以外的字符 \w 匹配任意的字母、下划线和数字,相当于 [A-Za-z0-9_]
\W 除所有字母、数字和下划线以外的字符 \s 匹配空格(包括但不限于换行符、制表符、空格符),相当于 [\t\r\n\v\f]
\S 匹配非空格的字符 日期格式:
^\d{4}-\d{1,2}-\d{1,2}
修饰符
修饰符约束正则执行的某些细节行为,比如是否区分大小写,是否支持多行匹配等。
/表达式/修饰符
i
表示ignore,正则匹配时字母不区分大小写g
表示global,全局匹配所有满足正则表达式的结果
replace替换
语法:
字符串.replace(/正则表达式/,'替换的文本')