一、正则表达式基础
1.什么是正则表达式
在需要对字符进行处理时,正则表达式就是用于对匹配字符串中字符组合的模式。在JavaScript中,一切皆对象,因此正则表达式也是一个对象。
2.正则表达式的语法基础
创建一个正则表达式
{
// 通过字面量的方式创建一个正则表达式
var reg = /\bis\b/g; // \b单词边界,模式匹配,g表示全局匹配
}
{
// 通过构造函数RegExp创建一个正则表达式
var reg = new RegExp("\\bis\\b","g"); // \b单词边界,模式匹配,g表示全局匹配
}
在脚本运行过程中,用构造函数创建的正则表达式会被编译,如果正则表达式会动态地改变,那么就需要使用构造函数来创建正则表达式,通常使用字面量形式创建。
正则的语法
标识:标识是正则表达式字面量的后缀和正则表达式构造函数的参数,它用来指示正则表达式的匹配行为。
- g:global,给定的正则表达式可以匹配多次,如果没有,那么匹配到一次结果后就会结束。
- i:ignoreCase,匹配正则表达式时忽略大小写
- m:multiline,在多行模式时,匹配时识别换行符
正则表达式由原义文本字符(如a,123等)和元字符组成以及一些特殊字符如:\、^、$、.、*、+、?、|、( )、{ }、[ ]。可以用\对特殊字符进行转义来表示它本身的含义
一般情况下,正则表达式的一个字符对应字符串的一个字符。当需要匹配一类字符时,可以使用 []来构造一个简单的类,也就是字符类。
{
var str = "a1b2c3d4"
// [abc]表示把abc三个字符归为一类,正则可以匹配这类字符,即任何一个
console.log(str.replace(/[abc]/g,"x")); // 输出 x1x2x3x4
// 使用 ^ 可以创建反向类,即匹配除了类中的字符
console.log(str.replace(/[^abc]/g,"x")) // 输出 axbxcxxx
}
范围类可以匹配一些范围,在[]中将范围连续书写
{
var str = "a1b2c3d4dde22"
// 匹配从a到z之间的任意字符
console.log(str.replace(/[a-z]/ig,"x")); // 输出 x1x2x3x4xxx22
// 匹配任意大小写字母和数字
console.log(str.replace(/[a-zA-Z0-9]/ig,"x")); //输出 xxxxxxxxxxxxx
let str2 = "2020-03-04";
console.log(str2.replace(/[0-9-]/ig,"*")); // 匹配所有数字和短横线
console.log(str2.replace(/[-]/ig,"*")); //匹配一个数字或一个短横线
}
正则表达式还提供了一些预定义的类,这样可以用来快捷的表示一些特定的范围。
{
预定义类:
. == [^\r\n] 除了回车符和换行符之外的所有字符
\d == [0-9] 数字字符
\D == [^0-9] 非数字字符
\s == [\t\n\x0B\f\r] 空白符:\f换页符、\r回车符、\t水平制表符、\n换行符、\x0b垂直制表符
\S == [^\t\n\x0B\f\r] 非空白符
\w == [a-zA-Z_0-9] 单词字符(包括字母、数字、下划线)
\W == [^a-zA-Z_0-9] 非单词字符(除了包括字母、数字、下划线)
}
正则表达式还提供了匹配边界的字符。
{
边界:
^ == 以什么字符开始
$ == 以什么字符结束
\b == 单词边界
\B == 非单词边界
}
{
let str = "@abc@123@"
console.log(str.replace(/^@./g,"Q")); // 输出 Qbc@123@
console.log(str.replace(/.@/g,"Q")); // 输出 @abQ12Q
console.log(str.replace(/.@$/g,"Q")); // 输出 @abc@12Q
}
量词:匹配字符连续出现n次的字符串,默认情况下量词是贪婪匹配的,也就是说它们会尽可能多地匹配
{
量词:匹配字符连续出现n次的字符串
? == 出现0次或1次
+ == 出现1次或多次
* == 出现0次或多次
{n} == 出现n次
{n,m} == 出现n到m次
{n,} == 出现n次或多次
}
贪婪模式:默认情况下,正则表达式会尽可能多的匹配
非贪婪模式:与贪婪模式相反,即尽可能少的匹配,一旦成功匹配就不再继续尝试其他的可能,在模式后面加上?
{
// 贪婪模式:尽可能多的匹配字符串
console.log("12345678".replace(/\d{3,6}/g,"x")); // 匹配6个字符 输出x78
// 非贪婪模式:尽可能少的匹配字符串
console.log("12345678".replace(/\d{3,6}?/g,"x")); // 每三个匹配一次 输出xx78
}
分组:如果要对字符串进行多次匹配,就需要进行分组
忽略分组:当不想捕获分组时,使用?:
反向引用:使用$n的方式引用模式中分组匹配到的字符,n为索引,从1开始
{
分组:n{3} n匹配三次 (bad){3} bad匹配三次
忽略分组:?:不想捕获分组时,从左往右开始编号
或:| 表示左右字符二选一
}
{
console.log("a1b2c3d4".replace(/[a-z]\d{3}/g,"x")); // 匹配任意字母加三个数字的,因此没有匹配成功
console.log("a1b2c3d4".replace(/([a-z]\d){3}/g,"x")); // 匹配三次字母加数字,输出 xd4
}
{
console.log("badboy".replace(/bad|boy/g,"x")); // 匹配bad或者boy,输出xx
console.log("ByrCasperByronsper".replace(/Byr(on|Ca)sper/g,"x")); // 匹配Byronsper或者ByrCasper,输出xx
}
{
// 匹配第一个分组为4个数字的,第二个分组为2个数字,第三个分组为2个数字,通过反向引用按照2、3、1顺序输出
console.log("2020-03-15".replace(/(\d{4})-(\d{2})-(\d{2})/g,"$2/$3/$1")); // 输出03/15/2020
// 忽略了分组?:就不会匹配到,保留字符本身
console.log("2020-03-15".replace(/(\d{4})-(\d{2})-(?:\d{2})/g,"$2/$3/$1"));// 输出03/$3/2020
console.log("2020-03-15".replace(/(\d{4})-(?:\d{2})-(?:\d{2})/g,"$2/$3/$1"));// 输出$2/$3/2020
}
正向前瞻:exp(?=assert)
负向前瞻:exp(?!assert)
exp和assert都是正则表达式,匹配到exp的同时还要判断assert是否符合条件,如果符合才会被匹配
{
console.log("a2*34V8".replace(/\w(?=\d)/g,"x")); // 表示匹配字符数字下划线开头后面是数字,输出 x2*x4x8
console.log("a2*34V8".replace(/\w(?!\d)/g,"x")); //输出 ax*3xVx
}
3.使用正则表达式
正则表达式可以被用于RegExp的exec和test方法以及String的match、replace、search和split方法。
方法 | 功能 |
---|---|
exec | 一个在字符串中执行查找匹配的RegExp方法,返回一个数组(未匹配到则返回 null) |
test | 一个在字符串中测试是否匹配的RegExp方法,返回 true 或 false |
match | 一个在字符串中执行查找匹配的String方法,返回一个数组,在未匹配到时会返回 null |
search | 一个在字符串中测试匹配的String方法,返回匹配到的位置索引,或者在失败时返回-1。 |
replace | 一个在字符串中执行查找匹配的String方法,并且使用替换字符串替换掉匹配到的子字符串 |
split | 一个使用正则表达式或者一个固定字符串分隔一个字符串,并将分隔后的子字符串存储到数组中 |
二、正则表达式的常见应用场景
{
// 1.用户名的正则验证
/^[a-z0-9_-]{3,16}$/
// 2.密码强度正则验证,密码是否同时包含字母和数字,长度为6到12位
/^(?=.*[0-9])(?=.*[a-zA-Z])(.{6,12})$/g
// 3.邮箱正则验证
/^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/
// 4.手机号正则验证
/^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$/
// 5.URL正则验证
/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/
}