正则表达式,字符串匹配、搜索、替换

str正则表达式,常常缩写为 “regex” 或 “regexp”,是帮助程序员匹配、搜索和替换文本的模式。

1.匹配字符

myWant = /code/; //不用引号

myWant.test(sentence)//sentence里匹配myWant字符code

2.多个字符串匹配

myWant = /yes|no|maybe/;

3.匹配时忽略大小写

myWant = /code/i;//i是忽略大小写标志

4. .match()方式

与。test()是反向的,返回ture/false;但是match返回匹配到的字符&null

'string'.match(/regex/);
/regex/.test('string');

5.全局多次匹配

 g是标志,这里 match 返回值 ["Repeat", "Repeat", "Repeat"]

let repeatRegex = /Repeat/g;
testStr.match(repeatRegex);

 多个标志/Repeat/gi

6.通配符代表任何字符

通配符 . 将匹配任何一个字符。 通配符也叫 dot 或 period。 可以像使用正则表达式中任何其他字符一样使用通配符。 例如,如果想匹配 hughuhhut 和 hum,可以使用正则表达式 /hu./ 匹配以上四个单词。

let huRegex = /hu./;

7.更灵活的匹配

可以使用字符集 (character classes)更灵活的匹配字符。 可以把字符集放在方括号([ 和 ])之间来定义一组需要匹配的字符串。

例如,如果想要匹配 bagbig 和 bug,但是不想匹配 bog。 可以创建正则表达式 /b[aiu]g/ 来执行此操作。 [aiu] 是只匹配字符 ai 或者 u 的字符集。

let bgRegex = /b[aiu]g/;

在字符集中,可以使用连字符(-)来定义要匹配的字符范围。

例如,要匹配小写字母 a 到 e,你可以使用 [a-e]。也可以匹配数字/[0-5]/

let bgRegex = /[a-e]at/;
let bgRegex = /[a-e2-4]at/;

 8.匹配单个未指定的字符-----否定字符集( negated character sets)

在开始括号后面和不想匹配的字符前面放置脱字符(即^)。

例如,/[^aeiou]/gi 匹配所有非元音字符。 注意,字符 .![@/ 和空白字符等也会被匹配,该否定字符集仅排除元音字符。

除了在字符集中使用之外,脱字符还用于匹配字符串的开始位置。(*上面用法有[],是否首位单词无[])

let firstString = "Ricky is first and can be found.";
let firstRegex = /^Ricky/;
firstRegex.test(firstString);
let notFirst = "You can't find Ricky now.";
firstRegex.test(notFirst);

第一次 test 调用将返回 true,而第二次调用将返回 false

9.匹配出现一次或多次字符+

有时,需要匹配出现一次或者连续多次的的字符(或字符组)。 这意味着它至少出现一次,并且可能重复出现。

可以使用 + 符号来检查情况是否如此。 记住,字符或匹配模式必须一个接一个地连续出现。 这就是说,字符必须一个接一个地重复。

例如,/a+/g 会在 abc 中匹配到一个匹配项,并且返回 ["a"]。 因为 + 的存在,它也会在 aabc 中匹配到一个匹配项,然后返回 ["aa"]

10.匹配出现零次或多次的字符*

执行该操作的字符叫做星号,即*

let soccerWord = "gooooooooal!";
let gPhrase = "gut feeling";
let oPhrase = "over the moon";
let goRegex = /go*/;
soccerWord.match(goRegex);
gPhrase.match(goRegex);
oPhrase.match(goRegex);

按顺序排列,三次 match 调用将返回值 ["goooooooo"]["g"] 和 null

11.用惰性匹配来查找字符

在正则表达式中,贪婪(greedy)匹配会匹配到符合正则表达式匹配模式的字符串的最长可能部分,并将其作为匹配项返回。 另一种方案称为懒惰(lazy)匹配,它会匹配到满足正则表达式的字符串的最小可能部分

可以将正则表达式 /t[a-z]*i/ 应用于字符串 "titanic"。 这个正则表达式是一个以 t 开始,以 i 结束,并且中间有一些字母的匹配模式。

正则表达式默认是贪婪匹配,因此匹配返回为 ["titani"]。 它会匹配到适合该匹配模式的最大子字符串。

但是,你可以使用 ? 字符来将其变成懒惰匹配。 调整后的正则表达式 /t[a-z]*?i/ 匹配字符串 "titanic" 返回 ["ti"]

12.匹配字符串的末尾$

匹配首部^,见8

可以使用正则表达式的美元符号 $ 来搜寻字符串的结尾。

let theEnding = "This is a never ending story";
let storyRegex = /story$/;
storyRegex.test(theEnding);

13.匹配所有的字母和数字 &&&匹配除了字母和数字的所有符号&&&匹配所有数字&&&匹配所有非数字

JavaScript 中与字母表匹配的最接近的元字符是\w。 这个缩写等同于[A-Za-z0-9_]。 此字符类匹配大写字母和小写字母以及数字。 注意,这个字符类也包含下划线字符 (_)。

let longHand = /[A-Za-z0-9_]+/;
let shortHand = /\w+/;

 可以使用 \W 搜寻和 \w 相反的匹配模式。 注意,相反匹配模式使用大写字母。 此缩写与 [^A-Za-z0-9_] 是一样的。

查找数字字符的缩写是 \d,注意是小写的 d。 这等同于元字符 [0-9],它查找 0 到 9 之间任意数字的单个字符。

查找非数字字符的缩写是 \D。 这等同于字符串 [^0-9],它查找不是 0 - 9 之间数字的单个字符。

14.匹配空白字符&&匹配非空白字符

可以用于统计非空格的字符个数

let whiteSpace = "Whitespace. Whitespace everywhere!"
let nonSpaceRegex = /\S/g;
whiteSpace.match(nonSpaceRegex).length;

返回值的 .length 应该是 32

可以使用 \s 搜寻空格,其中 s 是小写。 此匹配模式将匹配空格、回车符、制表符、换页符和换行符。 可以认为这类似于元字符 [ \r\t\f\n\v]。(各种形式的空格)

使用 \S 搜寻非空白字符,其中 s 是大写。 此匹配模式将不匹配空格、回车符、制表符、换页符和换行符。 可以认为这类似于元字符 [^ \r\t\f\n\v]

15.指定匹配的上限和下限

回想一下,使用加号 + 查找一个或多个字符,使用星号 * 查找零个或多个字符。 这些都很方便,但有时需要匹配一定范围的匹配模式。

可以使用数量说明符(quantity specifiers)指定匹配模式的上下限。 数量说明符与花括号({ 和 })一起使用。 可以在花括号之间放两个数字,这两个数字代表匹配模式的上限和下限。

例如,要匹配出现 3 到 5 次字母 a 的在字符串 ah,正则表达式应为/a{3,5}h/

/a{3,}h/三个以上;/a{3}h/确切3个

16.检查全部或无?

可以使用问号 ? 指定可能存在的元素。 这将检查前面的零个或一个元素。 可以将此符号视为前面的元素是可选的。

let american = "color";
let british = "colour";
let rainbowRegex= /colou?r/;
rainbowRegex.test(american);
rainbowRegex.test(british);

上面的 test 都会返回 true

17.正向先行断言和负向先行断言(检查一个字符串中的两个或更多匹配模式)

先行断言 (Lookaheads)是告诉 JavaScript 在字符串中向前查找的匹配模式。 当想要在同一个字符串上搜寻多个匹配模式时,这可能非常有用。

正向先行断言会查看并确保搜索匹配模式中的元素存在,但实际上并不匹配。 正向先行断言的用法是 (?=...),其中 ... 就是需要存在但不会被匹配的部分。

另一方面,负向先行断言会查看并确保搜索匹配模式中的元素不存在。 负向先行断言的用法是 (?!...),其中 ... 是希望不存在的匹配模式。 如果负向先行断言部分不存在,将返回匹配模式的其余部分。

先行断言的更实际用途是检查一个字符串中的两个或更多匹配模式。 这里有一个简单的密码检查器,密码规则是 3 到 6 个字符且至少包含一个数字:

let password = "abc123";
let checkPass = /(?=\w{3,6})(?=\D*\d)/;
checkPass.test(password);

18. 检查混合字符组()

如果想在字符串找到 Penguin 或 Pumpkin,可以用这个正则表达式:/P(engu|umpk)in/g

19.使用捕获组重用模式(找到重复的子字符串)

捕获组是通过把要捕获的正则表达式放在括号中来构建的。 在这个例子里, 目标是捕获一个包含字母数字字符的词,所以捕获组是将 \w+ 放在括号中:/(\w+)/

分组匹配的子字符串被保存到一个临时的“变量”, 可以使用同一正则表达式和反斜线及捕获组的编号来访问它(例如:\1)。 捕获组按其开头括号的位置自动编号(从左到右),从 1 开始。

在 reRegex 中使用捕获组来匹配一个只由相同的数字重复三次组成的由空格分隔字符串。

let repeatNum = "42 42 42";

let reRegex = /^(\d+)\s\1\s\1$/; // 修改这一行

let result = reRegex.test(repeatNum);//[ '42 42 42','42']

在字符串上调用 .match() 方法将返回一个数组,其中包含它最终匹配到的子字符串及其捕获组。

20.使用捕获组搜索和替换

可以在字符串上使用 .replace() 方法来搜索并替换字符串中的文本。 .replace() 的输入首先是想要搜索的正则表达式匹配模式。 第二个参数是用于替换匹配的字符串或用于执行某些操作的函数。

let wrongText = "The sky is silver.";
let silverRegex = /silver/;
wrongText.replace(silverRegex, "blue");

replace 调用将返回字符串 The sky is blue.

你还可以使用美元符号($)访问替换字符串中的捕获组。

"Code Camp".replace(/(\w+)\s(\w+)/, '$2 $1');

调用 replace 将返回字符串 Camp Code

删除开头和结尾的空白

let hello = "   Hello, World!  ";
let wsRegex = /^(\s+)|(\s+)$/g; // 别忘了g
let result = hello.replace(wsRegex,''); // ''内无内容 String.prototype.trim() 方法在这里也可以实现同样的效果,但是你需要使用正则表达式来完成此项挑战。
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值