什么是正则表达式?
正则表达式是构成搜索模式的字符序列
可以根据自己的搜索条件设置出,正则表达式来搜索自己需要的内容
正则表达式适用于执行所有类型的文本搜索或者文本替换
语法
/pattern/modifies
例如:
var patt = /w3scool/i
其中/w3school/i,是一个正则表达式
w3school是模式(pattern)(在搜素中使用)
i是一个修饰符,代表大小写不敏感
在ES5中,RegExp构造函数的参数有两种情况,
第一种是,参数时字符串,这时第二个参数表示正则表达式修饰符
var regex = new RegExp(‘xyz’,‘i’)
等同于
var regex = /xyz/i
第二种是,参数是一个正则表达式,这时会返回一个原有正则表达式的拷贝
var regex = new RegExp(/xyz/i)
等同于
var regex = /xyz/i
在使第二种方式时,ES5不允许此时使用,第二个参数添加修饰符,否则会报错
ES6改变了这种行为,如果RegExp构造函数第一个参数是一个正则对象,那么可以使用第二个参数指定修饰符,而且返回正则表达式会忽略原有的正则表达式的修饰符。
字符串的正则方法
可以使用正则表达式:match(),replace(),search(),split()
正则表达式中的替换方法:replace()
str.replace(regexp/str1,replacement)
第一个参数被替换的字符串或者正则表达式
第二个参数:用来做替换的字符串
返回的是一个替换后的新字符串
match:根据正则条件进行匹配,如果匹配到,返回匹配的结果,如匹配不到返回null
search:进行正则匹配,如果匹配到一个结果,则返回它的索引数,否则返回-1
split:进行正则分割,返回一个分割的数组
u修饰符
ES6对正则表达式添加了u修饰符,含义为“Unicode模式”,用来处理大于\uFFFF的Unicode字符,也就是说,会正确处理四个字节的UTF-16编码
ES5不支持四个字节的UTF-16编码,会将其识别为两个字符,
修饰符:
常见的修饰符有三种:i,g, m
其中i表示,执行大小写不敏感,也就是大小写对应的值是一样的,
g执行全局匹配,对字符串进行全部匹配,不再匹配到第一个后就停止
m执行多行匹配,对多行文本进行匹配
不是经常用但是比较有用的修饰符:u修饰符,y修饰符
y修饰符粘连修饰符
于全局配置g类似,但不同的是,y修饰符,匹配一次后,下次匹配是从剩余字符串的的头部开始的。
单一的一个y修饰符对match方法,只能返回第一个匹配,必须与g修饰符联用,才能返回所有匹配
RegExp.prototype.sticky属性,
与y修饰符相匹配,ES6的正则实例对象多了sticky属性,表示是否设置了y修饰符,
var r = /hello\d/y
r.sticky //true
RegExp.prototype.flags属性
ES6为正则表达式新增了flags属性,会返回正则表达式的修饰符
/abc/ig****.source****
//.source返回的是正则表达式的正文 该返回的是“abc”
/abc/ig****.flags****
返回的是‘gi’
s修饰符:dotAll模式
正则表达式中,点(.)是一个特殊字符,代表任意的单个字符,但是有两个例外,一个是
四个字节的UTF-16字符,这个可以用u修饰符解决,另一个是行终止符
但是我们希望其能够匹配的任意单个字符,这时有一种变通的写法
但是这种解决方法并适用,所以ES2018提供了,s修饰符,使得点可以匹配任意单个字符
具名组匹配
正则表达式使用圆括号进行组匹配
ES2018引入了具名组匹配,允许每一个组匹配指定一个名字,
正则表达式模式:
括号用于查找一定范围的字符串
[abc],查找方括号之间的任何字符
[0-9],查找任何0-9的数字
(x|y),查找又分隔号分开的任何选项
元字符:
\d,\s(查找空白字符)
\b(匹配单词边界)
\uXXXX,查找16进制以上的Unicode字符
+(匹配任何包含至少一个n的字符串),*(匹配包含零个或多个n的字符串),?(匹配任何包含零个或一个n的字符串)
**test()**是一个正则表达式方法,他通过模式来搜索字符串,然后根据结果返回true或false
exec()
他是通过指定的模式搜索字符串,并返回已找到的文本,如果未找到匹配则返回null
下面的例子搜索字符串中的