正则表达式

最新推荐文章于 2021-12-12 11:33:40 发布

Love_vermouth

最新推荐文章于 2021-12-12 11:33:40 发布

阅读量413

点赞数

分类专栏： JavaScript 文章标签：正则表达式 javascript

本文链接：https://blog.csdn.net/u010238381/article/details/50678908

版权

JavaScript 专栏收录该内容

53 篇文章 0 订阅

订阅专栏

RegExp 是正则表达式的缩写。当检索某个文本时，可以使用一种模式来描述要检索的内容，RegExp 就是这种模式。简单的模式可以是一个单独的字符，更复杂的模式包括了更多的字符，并用于解析、格式检查、替换等等。

可以规定字符串中的检索位置，以及要检索的字符类型，等等。

定义和使用：

1、使用RegExp构造函数，在运行时新建正则表达式 var patt1 = new RegExp("Hello",“i”);

2、使用字面量，以斜杠表示开始和结束，在编译时新建正则表达式 var patt2 = /Hello/i ;

test 方法

检索字符串中的指定值，返回值是 true 或 false

var pat = /today/;

var str = "It is a beautiful day today...";

console.log(pat.test(str)); // true

exec 方法

检索字符串中的指定值，返回值是被找到的值。如果不匹配，返回 null

var pat = /hello/;

console.log(pat.exec("oh hello world")); // ["hello", index: 3, input: "oh hello world"]

如果正则表示式包含圆括号（即要求“组匹配”），则返回的数组会包括多个元素。其中，第一个元素是整个匹配成功的结果，后面的元素就是圆括号对应的匹配成功的组。也就是说，第二个元素对应第一个括号，第三个元素对应第二个括号，以此类推。整个返回数组的length属性等于匹配成功的组数 + 1

var s = '_x_x';

var r = /_(x)/;

r.exec(s) // ["_x", "x"]

exec 方法返回数组还包含以下两个属性：

input— 整个原字符串

index — 整个模式匹配成功的开始位置（从0开始）

var r = /a(b+)a/;

var arr = r.exec("_abbba_aba_");

arr // ["abbba", "bbb"]

arr.index // 1

arr.input // "_abbba_aba_"

字符串查找 search() 按照给定的正则表达式进行搜索，返回一个整数，表示匹配开始的位置；如果没有任何匹配，则返回 -1

var str="Hello W3School!";

console.log(str.search(/w3school/)); //-1

console.log(str.search(/w3school/i)); // 6

正则表达式使用g修饰符之后，使用lastIndex属性指定开始匹配的位置，结果无效，还是从字符串的第一个字符开始匹配。

var r = /x/g;
r.lastIndex = 2; // 无效
'_x_x'.search(r) // 1

字符串匹配match() 返回一个数组，成员是所有匹配的子字符串

var str="8 plus 32 equal 40";

console.log(str.match(/\d+/)); // ["8", index: 0, input: "8 plus 32 equal 40"]

console.log(str.match(/\d+/g)); // ["8", "32", "40"]

如果正则表达式带有g修饰符，则该方法与正则对象的exec方法行为不同，会一次性返回所有匹配成功的结果。

var s = "abba";

var r = /a/g;

s.match(r) // ["a", "a"]

r.exec(s) // ["a"]

设置正则表达式的lastIndex属性，对match方法无效，匹配总是从字符串的第一个字符开始。

字符串替换 replace() 按照给定的正则表达式进行替换，返回替换后的字符串

var str="Hello Tom! I am sherry"

console.log(str.replace(/tom/, "Lily")); // Hello Tom! I am sherry

console.log(str.replace(/Tom/ig, "Mike")); // Hello Mike! I am sherry

字符串分割 split() 按照给定规则进行字符串分割，返回一个数组，包含分割后的各个成员

var str = "Hello Tom! I am sherry.";

str.split(""); // ["H", "e", "l", "l", "o", " ", "T", "o", "m", "!", " ", "I", " ", "a", "m", " ", "s", "h", "e", "r", "r", "y", "."]

str.split(/\s+/); // ["Hello", "Tom!", "I", "am", "sherry."]

如果正则表达式带有括号，则括号匹配的部分也会作为数组成员返回

"aaa*a*".split(/(a*)/) //["", "aaa", "*", "a", "*"]

1、修饰符

i 执行对大小写不敏感的匹配

g 执行全局匹配（查找所有匹配而非在找到第一个匹配后停止）。正则模式含有g修饰符，每次都是从上一次匹配成功处，开始向后匹配。

//不区分大小写，全局匹配

var str="hello Hunger valley! I am hunger";

var patt1=/hunger/gi;

console.log(str.match(patt1)); // ["Hunger", "hunger"]

lastIndex : 返回下一次开始搜索的位置，该属性可读写，但只在设置了g修饰符时有意义。

source : 返回正则表达式的字符串形式（不包括反斜杠），该属性只读。

var r = /abc/ig;

r.lastIndex // 0

r.source // "abc"

2、方括号：用于查找某个范围内的任意一个字符

[abc] 查找方括号之间的任意一个字符

[^abc} 查找不在方括号之间的任意一个字符，^ (脱字符，只有在字符类的第一个位置才有特殊含义，否则就是字面含义)

如果方括号内没有其他字符，即只有[^]，就表示匹配一切字符，其中包括换行符，而点号（.）是不包括换行符的

var s = 'Please yes\nmake my day!';
s.match(/yes.*day/) // null

s.match(/yes[^]*day/) // ['yes\nmake my day']

[0-9] 查找任意一个从 0 到 9 的数字

[a-z] 查找任意一个从小写 a 到小写 z 的字符

[A-Z] 查找任意一个从大写 A 到大写 Z 的字符

[A-z] 查找任意一个从大写 A 到小写z 的字符

- (连字符，提供简写形式，表示字符的连续范围，要用在方括号之中，并且在头尾两个字符中间)

比如，[abc]可以写成[a-c]，[0123456789]可以写成[0-9]，同理[A-Z]表示26个大写字母。

/a-z/.test('b') // false

/[a-z]/.test('b') // true

[-9]就表示匹配连字符和9，而不是匹配0到9。

[1-31]，不代表1到31，只代表1到3

[adgk] 查找给定集合内的任何字符

[^adgk] 查找给定集合外的任何字符

(red|blue|green) 查找任何指定的选项，竖线符号（|）在正则表达式中表示“或关系”（OR）

3、元字符(Metacharacter)

. 匹配单个字符，除了换行 (\n) 、回车 (\r) 、行分隔符 (\u2028)、段分隔符 (\u2029)

\w 匹配任意一个字母或数字或下划线，即 A~Z , a~z , _ 中任意一个，相当于[A-Za-z0-9_]

\W 查找非单词字符，相当于[^A-Za-z0-9_]

\d 匹配任意一个数字，0~9中的任意一个，相当于[0-9]

\D 查找非数字字符，相当于[^0-9]

\s 匹配空格、制表符、换页符等空白字符的任意一个，相等于[\t\r\n\v\f]

\S 查找非空白字符，相当于[^\t\r\n\v\f]

\b 匹配单词边界，本身不匹配任何字符，它在匹配结果中所处位置的左右两边，一边是 "/w' 范围，一边非 "/w" 范围

\B 匹配非单词边界，即在词的内部

\0 查找NULL字符

\n 查找换行符，通常，正则表达式遇到换行符（\n）就会停止匹配。

\f 查找换页符

\r 查找回车符

\t 查找制表符 tab

\v 查找垂直制表符

\xxx 查找以八进制数 xxx 规定的字符

\xdd 查找以十六进制数 dd 规定的字符

\uxxxx 查找以十六进制数 xxxx 规定的 Unicode 字符

4、量词

n+ 匹配任何包含至少一个 n 的字符串，相当于 {1,}

n* 匹配任何包含零个或任意个 n 的字符串，相当于 {0,}

n? 匹配任何包含零个或一个 n 的字符串，相当于 {0,1}

n{X} 匹配包含 X 个 n 的序列的字符串

n{X,Y} 匹配包含 X 至 Y 个 n 的序列的字符串，例如："at{1,3}" 可以匹配 "at" 或 "att" 或 "attt"

n{X,} 匹配包含至少 X 个 n 的序列的字符串

n$ 匹配任何结尾为 n 的字符串

^n 匹配任何开头为 n 的字符串

?=n 匹配任何其后紧接指定字符串 n 的字符串

?!n 匹配任何其后没有紧接指定字符串 n 的字符串

5、简单的转义字符（^、.、[、$、(、)、|、*、+、?、{和\\这12个字符需要用斜杠转义）

\^ 匹配 ^ 符号本身

\$ 匹配 $ 符号本身

\. 匹配小数点本身

如果使用RegExp方法生成正则对象，转义需要使用两个斜杠，因为字符串内部会先转义一次。

贪婪模式

+、*、? 这三个量词符，默认情况下都是最大可能匹配，即匹配直到下一个字符不满足匹配规则为止。这被称为贪婪模式。

var s = 'aaa';
s.match(/a+/) // ["aaa"]

如果想将贪婪模式改为非贪婪模式，可以在量词符后面加一个问号

var s = 'aaa';
s.match(/a+?/) // ["a"]

模式结尾添加了一个问号/a+?/，这时就改为非匹配模式，一旦条件满足，就不再往下匹配。

组匹配

1、使用组匹配时，不宜同时使用g修饰符，否则match方法不会捕获分组的内容。

var m = 'abcabc'.match(/(.)b(.)/g);
m // ["abc", "abc"]

var m = 'abcabc'.match(/(.)b(.)/);

m // ["abc", "a", "c"]

2、在正则表达式内部，可以用\n引用括号匹配的内容，n是从1开始的自然数，表示对应顺序的括号。

/(.)b(.)\1b\2/.test("abcabc") // true \1表示前一个括号匹配的内容（即“a”），\2表示第二个括号匹配的内容（即“c”）

非捕获组

(?:x)称为非捕获组（Non-capturing group），表示不返回该组匹配的内容，即匹配的结果中不计入这个括号。

var m = 'abc'.match(/(?:.)b(.)/);
m // ["abc", "c"]

先行断言

x(?=y)称为先行断言（Positive look-ahead），x只有在y前面才匹配，y不会被计入返回结果。

var m = 'abc'.match(/b(?=c)/);
m // ["b"]

后行断言

x(?!y)称为后行断言（Negative look-ahead），x只有不在y前面才匹配，y不会被计入返回结果。

var m = 'abd'.match(/b(?!c)/);
m // ["b"]

/\d+(?!\.)/.exec('3.14') // ["14"]

最后，分享两个不错的网站：

正则表达式调试工具 http://www1.w3cfuns.com/tools.php?mod=regex

分析工具 http://regexper.com/

Love_vermouth

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式

本文讲述了基础的正则表达式。
复制链接

扫一扫

专栏目录