JavaScript学习笔记（六）：正则表达式

最新推荐文章于 2024-05-15 22:15:35 发布

EverglowCP

最新推荐文章于 2024-05-15 22:15:35 发布

阅读量123

点赞数

分类专栏： JavaScript高级进阶文章标签： javascript

本文链接：https://blog.csdn.net/EverglowCP/article/details/117231875

版权

JavaScript高级进阶专栏收录该内容

15 篇文章 0 订阅

订阅专栏

正则表达式

一、正则表达式基础
二、正则表达式的常见应用场景

一、正则表达式基础

1.什么是正则表达式

在需要对字符进行处理时，正则表达式就是用于对匹配字符串中字符组合的模式。在JavaScript中，一切皆对象，因此正则表达式也是一个对象。

2.正则表达式的语法基础

创建一个正则表达式

{
		// 通过字面量的方式创建一个正则表达式
        var reg = /\bis\b/g; // \b单词边界，模式匹配，g表示全局匹配
}
{
		// 通过构造函数RegExp创建一个正则表达式
        var reg = new RegExp("\\bis\\b","g"); // \b单词边界，模式匹配，g表示全局匹配
}

在脚本运行过程中，用构造函数创建的正则表达式会被编译，如果正则表达式会动态地改变，那么就需要使用构造函数来创建正则表达式，通常使用字面量形式创建。

正则的语法

标识：标识是正则表达式字面量的后缀和正则表达式构造函数的参数，它用来指示正则表达式的匹配行为。

g：global，给定的正则表达式可以匹配多次，如果没有，那么匹配到一次结果后就会结束。
i：ignoreCase，匹配正则表达式时忽略大小写
m：multiline，在多行模式时，匹配时识别换行符

正则表达式由原义文本字符（如a,123等）和元字符组成以及一些特殊字符如：\、^、$、.、*、+、？、|、( )、{ }、[ ]。可以用\对特殊字符进行转义来表示它本身的含义

一般情况下，正则表达式的一个字符对应字符串的一个字符。当需要匹配一类字符时，可以使用 []来构造一个简单的类，也就是字符类。

{
		var str = "a1b2c3d4"
		// [abc]表示把abc三个字符归为一类，正则可以匹配这类字符，即任何一个
    	console.log(str.replace(/[abc]/g,"x")); // 输出 x1x2x3x4
		// 使用 ^ 可以创建反向类，即匹配除了类中的字符
		console.log(str.replace(/[^abc]/g,"x")) // 输出 axbxcxxx
}

范围类可以匹配一些范围，在[]中将范围连续书写

{
        var str = "a1b2c3d4dde22"
        // 匹配从a到z之间的任意字符
        console.log(str.replace(/[a-z]/ig,"x")); // 输出 x1x2x3x4xxx22
		// 匹配任意大小写字母和数字
        console.log(str.replace(/[a-zA-Z0-9]/ig,"x")); //输出 xxxxxxxxxxxxx
        let str2 = "2020-03-04";
        console.log(str2.replace(/[0-9-]/ig,"*")); // 匹配所有数字和短横线
        console.log(str2.replace(/[-]/ig,"*")); //匹配一个数字或一个短横线
    }

正则表达式还提供了一些预定义的类，这样可以用来快捷的表示一些特定的范围。

{
		预定义类：
            . == [^\r\n] 除了回车符和换行符之外的所有字符
            \d == [0-9] 数字字符
            \D == [^0-9] 非数字字符
            \s == [\t\n\x0B\f\r] 空白符：\f换页符、\r回车符、\t水平制表符、\n换行符、\x0b垂直制表符
            \S == [^\t\n\x0B\f\r] 非空白符
            \w == [a-zA-Z_0-9] 单词字符(包括字母、数字、下划线)
            \W == [^a-zA-Z_0-9] 非单词字符(除了包括字母、数字、下划线)
}

正则表达式还提供了匹配边界的字符。

{
		边界：
            ^ == 以什么字符开始
            $ == 以什么字符结束
            \b == 单词边界
            \B == 非单词边界
}
{
		let str = "@abc@123@"
        console.log(str.replace(/^@./g,"Q")); // 输出 Qbc@123@
        console.log(str.replace(/.@/g,"Q")); // 输出 @abQ12Q
        console.log(str.replace(/.@$/g,"Q")); // 输出 @abc@12Q
}

量词：匹配字符连续出现n次的字符串，默认情况下量词是贪婪匹配的，也就是说它们会尽可能多地匹配

{
		量词：匹配字符连续出现n次的字符串
            ? == 出现0次或1次
            + == 出现1次或多次
            * == 出现0次或多次
            {n} == 出现n次
            {n,m} == 出现n到m次
            {n,} == 出现n次或多次
}

贪婪模式：默认情况下，正则表达式会尽可能多的匹配
非贪婪模式：与贪婪模式相反，即尽可能少的匹配，一旦成功匹配就不再继续尝试其他的可能，在模式后面加上?

{
		// 贪婪模式：尽可能多的匹配字符串
        console.log("12345678".replace(/\d{3,6}/g,"x")); // 匹配6个字符 输出x78
        // 非贪婪模式：尽可能少的匹配字符串
        console.log("12345678".replace(/\d{3,6}?/g,"x")); // 每三个匹配一次 输出xx78
}

分组：如果要对字符串进行多次匹配，就需要进行分组
忽略分组：当不想捕获分组时，使用?:
反向引用：使用$n的方式引用模式中分组匹配到的字符，n为索引，从1开始

{
		分组：n{3} n匹配三次   (bad){3} bad匹配三次
        忽略分组：?:不想捕获分组时，从左往右开始编号
        或：| 表示左右字符二选一
}
{
		console.log("a1b2c3d4".replace(/[a-z]\d{3}/g,"x")); // 匹配任意字母加三个数字的，因此没有匹配成功
        console.log("a1b2c3d4".replace(/([a-z]\d){3}/g,"x")); // 匹配三次字母加数字，输出 xd4
}
{
		console.log("badboy".replace(/bad|boy/g,"x")); // 匹配bad或者boy，输出xx
		console.log("ByrCasperByronsper".replace(/Byr(on|Ca)sper/g,"x")); // 匹配Byronsper或者ByrCasper，输出xx
}
{		
		// 匹配第一个分组为4个数字的，第二个分组为2个数字，第三个分组为2个数字，通过反向引用按照2、3、1顺序输出
		console.log("2020-03-15".replace(/(\d{4})-(\d{2})-(\d{2})/g,"$2/$3/$1")); // 输出03/15/2020
        // 忽略了分组?:就不会匹配到，保留字符本身
        console.log("2020-03-15".replace(/(\d{4})-(\d{2})-(?:\d{2})/g,"$2/$3/$1"));// 输出03/$3/2020
        console.log("2020-03-15".replace(/(\d{4})-(?:\d{2})-(?:\d{2})/g,"$2/$3/$1"));// 输出$2/$3/2020
}

正向前瞻：exp(?=assert)
负向前瞻：exp(?!assert)
exp和assert都是正则表达式，匹配到exp的同时还要判断assert是否符合条件，如果符合才会被匹配

{
		console.log("a2*34V8".replace(/\w(?=\d)/g,"x")); // 表示匹配字符数字下划线开头后面是数字，输出 x2*x4x8
        console.log("a2*34V8".replace(/\w(?!\d)/g,"x")); //输出 ax*3xVx
}

3.使用正则表达式

正则表达式可以被用于RegExp的exec和test方法以及String的match、replace、search和split方法。

方法	功能
exec	一个在字符串中执行查找匹配的RegExp方法，返回一个数组（未匹配到则返回 null）
test	一个在字符串中测试是否匹配的RegExp方法，返回 true 或 false
match	一个在字符串中执行查找匹配的String方法，返回一个数组，在未匹配到时会返回 null
search	一个在字符串中测试匹配的String方法，返回匹配到的位置索引，或者在失败时返回-1。
replace	一个在字符串中执行查找匹配的String方法，并且使用替换字符串替换掉匹配到的子字符串
split	一个使用正则表达式或者一个固定字符串分隔一个字符串，并将分隔后的子字符串存储到数组中

二、正则表达式的常见应用场景

{
	// 1.用户名的正则验证
	/^[a-z0-9_-]{3,16}$/
	// 2.密码强度正则验证，密码是否同时包含字母和数字，长度为6到12位
	/^(?=.*[0-9])(?=.*[a-zA-Z])(.{6,12})$/g
	// 3.邮箱正则验证
	/^([A-Za-z0-9_\-\.])+\@([A-Za-z0-9_\-\.])+\.([A-Za-z]{2,4})$/
	// 4.手机号正则验证
	/^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,5-9]))\d{8}$/
	// 5.URL正则验证
	/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/
}