正则表达式
1、正则表达式简介
-
正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。
-
典型的搜索和替换操作要求提供与预期的搜索结果匹配的确切文本。虽然这种技术对于对静态文本执行简单搜索和替换任务可能已经足够了,但它缺乏灵活性,若采用这种方法搜索动态文本,也会变得很困难。
-
通过使用正则表达式能够:
- 测试字符串内的模式。(数据验证)
- 替换文本。(文本操作)
- 基于模式匹配从字符串中提取子字符串。(目标提取)
2、正则表达式语法
- JavaScript RegExp对象的创建:
var patt=new RegExp(pattern,modifiers);
var patt=/pattern/modifiers;
//pattern(模式) 描述了表达式的模式
//modifiers(修饰符) 用于指定全局匹配、区分大小写的匹配和多行匹配
2.1 修饰符
- 修饰符用于执行区分大小写和全局匹配
修饰符 | 描述 |
---|---|
i | 执行对大小写不敏感的匹配 /a/i |
g | 执行全局匹配 /a/g |
m | 执行多行匹配 /a/m |
2.2 方括号
表达式 | 描述 |
---|---|
[abc] | 查找方括号之间(给定集合内)的任何字符 |
[^abc] | 查找任何不在方括号之间(给定集合外)的字符 |
[0-9] | 查找任何从 0 至 9 的数字 |
[a-z] | 查找任何从小写 a 到小写 z 的字符 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符 |
(a|b|c) | 查找任何指定的选项 |
2.3 元字符
- 元字符(Metacharacter)是拥有特殊含义的字符
元字符 | 描述 |
---|---|
. | 查找单个字符,除了换行和行结束符 |
\w | 查找数字、字母及下划线 |
\W | 查找非单词字符 |
\d | 查找数字 |
\D | 查找非数字字符 |
\s | 查找空白字符 |
\S | 查找非空白字符 |
\b | 匹配单词边界 |
\B | 匹配非单词边界 |
\0 | 查找 NULL 字符 |
\n | 查找换行符 |
\f | 查找换页符 |
\r | 查找回车符 |
\t | 查找制表符 |
\v | 查找垂直制表符 |
\xxx | 查找以八进制数 xxx 规定的字符 |
\xdd | 查找以十六进制数 dd 规定的字符 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符 |
2.4 量词
量词 | 描述 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串 |
n* | 匹配任何包含零个或多个 n 的字符串 |
n? | 匹配任何包含零个或一个 n 的字符串 |
n{X} | 匹配包含 X 个 n 的序列的字符串 |
n{X,} | X 是一个正整数。前面的模式 n 连续出现至少 X 次时匹配 |
n{X,Y} | X 和 Y 为正整数。前面的模式 n 连续出现至少 X 次,至多 Y 次时匹配 |
n$ | 匹配任何结尾为 n 的字符串 |
^n | 匹配任何开头为 n 的字符串 |
?=n | 匹配任何其后紧接指定字符串 n 的字符串 |
?!n | 匹配任何其后没有紧接指定字符串 n 的字符串 |
2.5 运算符优先级
- 正则表达式从左到右进行计算,并遵循优先级顺序,这与算术表达式非常类似。相同优先级的从左到右进行运算,不同优先级的运算先高后低。
运算符 | 描述 |
---|---|
\ | 转义符 |
(), (?😃, (?=), [] | 圆括号和方括号 |
*, +, ?, {n}, {n,}, {n,m} | 限定符 |
^, $, \任何元字符、任何字符 | 定位点和序列 |
| | 替换,"或"操作 |
3、正则表达式API
3.1 RegExp对象属性
global
- 判断是否设置了 “g” 修饰符,如果 g 标志被设置,则该属性为 true,否则为 false
RegExpObject.global
ignoreCase
- 判断是否设置了 “i” 修饰符,如果设置了 “i” 标志,则返回 true,否则返回 false
RegExpObject.ignoreCase
multiline
- 判断是否设置了 “m” 修饰符,如果 m 标志被设置,则该属性为 true,否则为 false
RegExpObject.multiline
source
- 返回正则表达式的匹配模式
RegExpObject.source
lastIndex
- 用于规定下次匹配的起始位置,该属性只有设置标志 g 才能使用
RegExpObject.lastIndex
3.2 RegExp对象方法
exec
- 检索字符串中指定的值。返回找到的值,并确定其位置。
RegExpObject.exec(string)
test
-
检索字符串中指定的值。返回 true 或 false。
-
RegExpObject.test(string)
toString
- 返回正则表达式的字符串。
RegExpObject.toString()
3.3 支持正则表达式的String对象方法
search
-
检索与正则表达式相匹配的值,找到返回起始位置,如果没有找到任何匹配的子串,则返回 -1
-
string.search(searchvalue)
match
- 找到一个或多个正则表达式的匹配,如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
string.match(regexp)
replace
-
替换与正则表达式匹配的子串
-
string.replace(searchvalue,newvalue)
split
- 把字符串分割为字符串数组
string.split(separator,limit)
4、正则表达式应用
-
简单表达式
/a/
,匹配a -
字符匹配
/a.c
,匹配 aac、abc、acc、adc 等等 -
中文
/[\u4E00-\u9FA5]/
-
用户名
/^[a-zA-Z0-9_-]{4,16}$/
4到16位字母、数字、下划线和中划线组成 -
车牌号
/^[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z]{1}[A-Z]{1}[A-Z0-9]{4}[A-Z0-9挂学警港澳]{1}$/
-
微信号
/^[a-zA-Z][-_a-zA-Z0-9]{5,19}$/
6至20位,以字母开头,字母,数字,减号,下划线 -
QQ号
/^[1-9][0-9]{4,10}$/
5至11位数字组成 -
16进制颜色
/^#([a-fA-F0-9]{6}|[a-fA-F0-9]{3})$/
以#开始 ,6或3个字符(A-F、a-f、0-9)结尾 -
电话号码
/^1(3\d|4[5-9]|5[0-35-9]|6[2567]|7[0-8]|8\d|9[0-35-9])\d{8}$/
以1开头,3可跟任一数字(\d),4可跟5-9,5可跟0-3或5-9 ,6后2567其中一个,7后是0-8,8后任一数字,9后是0-3或3-5,其余8位是任意数字(\d{8}) -
身份证号
/^[1-9]\d{5}(19|20|21)\d{2}(0[1-9]|10|11|12)(0[1-9]|[1-2]\d|30|31)\d{3}[\dX]$/
第一位在0-9区间,后面是5位任意数字,4位年份(19、20、21开头,后两位任意),两位代表月份(0开头的1-9或者是10、11、12),两位日期(01-31),三位顺序码,最后一位是校验码,可数字可X -
网址
/^((https?):)?\/\/([^?:/]+)(:(\d+))?(\/[^?]*)?(\?(.*))?/
-
邮箱
/^(([^<>()[\]\\.,;:\s@\"]+(\.[^<>()[\]\\.,;:\s@\"]+)*)|(\".+\"))@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\])|(([a-zA-Z\-0-9]+\.)+[a-zA-Z]{2,}))$/
-
最后推荐一下一个网站 – 正则表达式在线测试网站: 正则表达式在线测试 ,在这里可以书写正则表达式并在线测试,还有常见应用案例提示以及可视化图等相关功能!