正则表达式用于字符串的查找和替换,是使用单个字符串来描述,匹配一系列符合某个句法规则的字符串。
安利一个正则图形化工具,可以在上面测试正则。
正则方法
js中提供了一些正则的方法
RegExp.prototype.test()
String.prototype.match()
String.prototype.replace()
其他3个不列举了,注意这些方法的调用对象,第一个是由正则表达式调用的,字符串为参数,第二个第三个是由字符串调用的,正则表达式为参数
下面进入正题
简单模式匹配
/abc/是一个最简单的模式匹配,匹配包含’abc’且中间不能包含其他字符的字符串
/abc/.test('abc') // return true
/abc/.test('babcb') // return true
/abc/.test('adbc') // return false,中间多了一个d
使用特殊字符
如果也想匹配abbbbc怎么办,这时候可以把bbbb看成一个整体,使用*(*的意思是前面一项出现了零个或者多个),这里就是说b出现了零次或者多次,也可以使用+表示匹配了一次或者多次
/ab*c/.test('abbbbbc') // return true
/ab*c/.test('abbbc') // return true
/ab*c/.test('ac') // return true
/ab+c/.test('ac') // return false
使用^匹配输入的开始,在正则表达式中是区分大小写的,Aa中的a因为不是在字符串的开始,所以不能匹配Aa中的a
/^a/.test('abc') // return true
/^a/.test('Aa') // return false
使用$匹配输入的结束
/a$/.test('Aa') // return true
?匹配前面一个表达式0次或者1次。等价于 {0,1},同理可得,前面说到的*等同于{0,},+等同于{1,}
/a?Aa?/.test('Aa') // return true
/a?Aa?/.test('Aaa') // return true
/a{0,1}Aa{0,1}/.test('Aa') // return true
/g (全文查找出现的所有匹配字符),/gi(全文查找、忽略大小写)
/ig(全文查找、忽略大小写),使用方法为
//转义'<'
str = str.replace(/</g, '<');
小数点
这里要特别聊一下小数点.,小数点.匹配除了换行符(\n)之外的任何单个字符
/.a/.test('Aa') // return true
/.a/.test('AAa') // return true
/.a/.test('aA') // return false
而当我们想匹配一个url的结尾比如.com,这时候就要用到转义了,为什么要转义,因为小数点.在正则中有自己的用法,如果你想表达.的时候,就需要在前面加一个转义字符\
/\.com/.test('A.com') // return true
/\.com/.test('Acom') // return false
贪婪模式
贪婪模式指的是正则默认匹配最长的字符串
'abcbbc'.match(/a.*c/) // return ['abcbbc']
这时候我想只返回符合正则的最短字符串怎么办,就要通过?使用非贪婪模式
'abcbbc'.match(/a.*?c/) // return ['abc']
那怎么区分?的这种用法,别担心,想使用非贪婪模式(最短的模式),?只能跟在数量符后面
*?
+?
?? 重复0次或1次,使用非贪婪模式
{n,m}? 重复n到m次,使用非贪婪模式
replace的回调
var text = 'cat, bat, sat, fat';
//注意分组要加括号
var result = text.replace(/(.at)/g, 'word ($1)');
result //word (cat), word (bat), word (sat), word (fat)
n匹配第n个捕获组的字符串,
1是匹配第一个捕获组的字符串。如果正则表达式中没有定义捕获组,则使用空字符串。
我们可以看一下对用户输入的编码函数
function htmlEscape(text){
return text.replace(/[<>"&]/g, function(match, pos, originalText){
switch(match){
case '<':
return '<';
case '>':
return '>';
case '&':
return '&';
case '\"':
return
}
})
}
split
split的第一个参数可以是正则表达式,也可以是字符串,而第二个参数用来指定返回的数组不会超过既定大小
var str = 'cat bat sat fat';
var arr1 = str.split(/\s/g); //["cat", "bat", "sat", "fat"]
var arr2 = str.split(/\s/g, 2) // ["cat", "bat"]
更多相关的知识可以移步正则表达式前端使用手册