正则表达式整理

最新推荐文章于 2023-10-09 16:41:19 发布

qq_33989590

最新推荐文章于 2023-10-09 16:41:19 发布

阅读量197

点赞数 2

分类专栏： js 文章标签：正则表达式 js javascript

本文链接：https://blog.csdn.net/qq_33989590/article/details/111313827

版权

js 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、限定符

?: 它前面的字符需要出现0次或一次
例如：used?可以匹配use和used
*: 它前面的字符需要出现0次或多次
例如：ab*c能匹配，ac，abc，abbbbc...
+: 它前面的字符最少出现一次
例如：ab+c能匹配，abc，abbbbc,abbbbbbbc...不能匹配ac
{}: 可以限定匹配的数量
例如：ab{6}c可以匹配abbbbbbc, ab{1,3}c可以匹配abc, abbc,abbbc,如果两次以上则可以写成，ab{2,}c

二、“或”运算符

例如：a(cat|dog)能匹配acat，adog

三、字符类

[]:表示字符只能从[]内选取

例如：[a-z]表示所有小写的英语字母，[abc]能从abcd匹配到a,b,c,如果表示[]之外的字符[^]

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=(([^?&=]+))/
// a=1
// b=2
// c=3

四、元字符

\d: 数字字符
\w: 单词字符
\s: 空白字符
\D: 非数字字符
\W: 非单词字符
\S: 非空白字符
.: 任意字符，不包含换行符
^: 匹配以什么开头，例如：^a,匹配abc，acd...,匹配以a开头
$: 匹配以什么结尾，例如：a$,匹配tea，cba，匹配以a结尾

五、贪婪与懒惰匹配

贪婪匹配: 正则表达式通常的行为是匹配尽可能多的字符，比如表达式：a.*b，它会匹配最长的以a开始，以b结束的字符串，如果用它来搜索aabab的话，它会匹配整个字符串aabab

懒惰匹配: 就是匹配尽可能少的字符，在能使整个匹配成功的前提下使用最少的重复，只要在他后面加上一个问号？即可，例如: a.*?b匹配最短的以a开始以b结束的字符串，例如：aabasb,会匹配到aab和asb两个字符串,为什么匹配的是aab，而不是ab是因为正则表达式最先开始的匹配拥有最高的优先权

常用非贪婪表达式：

*? 重复任意次，但尽可能少重复
+? 重复1次或更多次，但尽可能少重复
?? 重复0次或1次，但尽可能少重复
{n,m}? 重复n到m次，但尽可能少重复
{n,}? 重复n次以上，但尽可能少重复

六、match，replace，exec，test

test
test为正则表达式对象的属性，使用方式：
```
var reg = /^a.+?b$/; reg.test('asdadb'); // true
```
exec也为正则表达式对象的属性，使用方式：
```
var reg = /^a.+?b$/; 
reg.exec('asdadb'); // ["asdadb", index: 0, input: "asdadb", groups: undefined]
```
如果 exec() 找到了匹配的文本，则返回一个结果数组。否则，返回 null。此数组的第 0 个元素是与正则表达式相匹配的文本，第 1 个元素是与 RegExpObject 的第 1 个子表达式相匹配的文本（如果有的话），第 2 个元素是与 RegExpObject 的第 2 个子表达式相匹配的文本（如果有的话），以此类推。除了数组元素和 length 属性之外，exec() 方法还返回两个属性。index 属性声明的是匹配文本的第一个字符的位置。input 属性则存放的是被检索的字符串 string。我们可以看得出，在调用非全局的 RegExp 对象的 exec() 方法时，返回的数组与调用方法 String.match() 返回的数组是相同的。

但是，当 RegExpObject 是一个全局正则表达式时，exec() 的行为就稍微复杂一些。它会在 RegExpObject 的 lastIndex 属性指定的字符处开始检索字符串 string。当 exec() 找到了与表达式相匹配的文本时，在匹配后，它将把 RegExpObject 的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说，您可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时，它将返回 null，并把 lastIndex 属性重置为 0。
正则表达式带g
```
var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/g;
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //["b=2", "b", "2", index: 25, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //["c=3", "c", "3", index: 29, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //null
reg.lastIndex = 0;  //这段代码很重要哦，注意理解
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
```

正则表达式不带g

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/g;
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
reg.lastIndex = 0;
console.log(reg.exec(url)); //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]

3. match函数

用法：stringObject.match(searchvalue | regexp)

返回值：存放匹配结果的数组。该数组的内容依赖于 regexp 是否具有全局标志 g。

如果 regexp 没有标志 g，那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本， match() 将返回 null。否则，它将返回一个数组，其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本，而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外，返回的数组还含有两个对象属性。 index 属性声明的是匹配文本的起始字符在 stringObject 中的位置，input 属性声明的是对 stringObject 的引用。

如果 regexp 具有标志 g，则 match() 方法将执行全局检索，找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串，则返回 null。如果找到了一个或多个匹配子串，则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同，它的数组元素中存放的是 stringObject 中所有的匹配子串，而且也没有 index 属性或 input 属性。

不带修饰符g

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/;
var result = url.match(reg);
console.log(result);    //["a=1", "a", "1", index: 21, input: "http://www.baidu.com?a=1&b=2&c=3"]
console.log(result.index);  //21
console.log(result.input);  //http://www.baidu.com?a=1&b=2&c=3

带修饰符g

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/g;
var result = url.match(reg);
console.log(result);    //["a=1", "b=2", "c=3"]
console.log(result.index);  //undefined
console.log(result.input);  //undefined

4.replace函数

用法：stringObject.replace(regexp/substr,replacement)

返回值：一个新的字符串，是用 replacement 替换了 regexp 的第一次匹配或所有匹配之后得到的。

描述：字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串，然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g，那么 replace() 方法将替换所有匹配的子串。否则，它只替换第一个匹配子串。

replacement 可以是字符串，也可以是函数。如果它是字符串，那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示，它说明从模式匹配得到的字符串将用于替换。

字符	替换文本
$1、$2、...、$99	与 regexp 中的第 1 到第 99 个子表达式相匹配的文本。
$&	与 regexp 相匹配的子串
$`	位于匹配子串左侧的文本。
$'	位于匹配子串右侧的文本。
$$	直接量符号。（意思就是要替换为 $ 符号的时候，就写两个$）

不带修饰符g

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/;
var url1 = url.replace(reg,function(a,b,c,d,e){
    console.log(a,b,c,d,e); //a=1, a, 1, 21, http://www.baidu.com?a=1&b=2&c=3
    return 'ok';
})
console.log(url1);  //http://www.baidu.com?ok&b=2&c=3

带修饰符g

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/g;
var url1 = url.replace(reg,function(a,b,c,d,e){
    console.log(a,b,c,d,e); //执行3次，分别输出为：a=1, a, 1, 21, http://www.baidu.com?a=1&b=2&c=3 和 b=2, b, 2, 25, http://www.baidu.com?a=1&b=2&c=3 和 | c=3, c, 3, 29, http://www.baidu.com?a=1&b=2&c=3
    return 'ok';
})
console.log(url1);  //http://www.baidu.com?ok&ok&ok

第二个参数为字符串时

var url = 'http://www.baidu.com?a=1&b=2&c=3';
var reg = /([^?&=]+)=([^?&=])*/;    //不带修饰符g
var url1 = url.replace(reg,"$&")
console.log(url1);  //http://www.baidu.com?a=1&b=2&c=3
var url1 = url.replace(reg,"$1")
console.log(url1);  //http://www.baidu.com?a&b=2&c=3
var url1 = url.replace(reg,"$2")
console.log(url1);  //http://www.baidu.com?1&b=2&c=3
var url1 = url.replace(reg,"$'")
console.log(url1);  //http://www.baidu.com?&b=2&c=3&b=2&c=3

var reg = /([^?&=]+)=([^?&=])*/g;   //带修饰符g
var url1 = url.replace(reg,"$&")
console.log(url1);  //http://www.baidu.com?a=1&b=2&c=3
var url1 = url.replace(reg,"$1")
console.log(url1);  //http://www.baidu.com?a&b&c
var url1 = url.replace(reg,"$2")
console.log(url1);  //http://www.baidu.com?1&2&3
var url1 = url.replace(reg,"$'")
console.log(url1);  //http://www.baidu.com?&b=2&c=3&&c=3&

qq_33989590

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式整理

一、限定符?: 它前面的字符需要出现0次或一次例如：used?可以匹配use和used *: 它前面的字符需要出现0次或多次例如：ab*c能匹配，ac，abc，abbbbc... +: 它前面的字符最少出现一次例如：ab+c能匹配，abc，abbbbc,abbbbbbbc...不能匹配ac {}: 可以限定匹配的数量例如：ab{6}c可以匹配abbbbbbc, ab{1,3}c可以匹配abc, abbc,abbbc,如果两次以上则可以写成，ab{2,}c二、“或”运算符例如：
复制链接

扫一扫

专栏目录