文章目录
- 前言
- 一、正则表达式是什么?
- 二、正则概念
-
正则表达式的作用
- 正则表达式的特点
- 正则的组成
-
- 三、正则的组成
-
特殊字符
-
常用元字符
-
限定符
-
其他符号
-
-
四、创建正则对象
前言
正则表达式,又称规则表达式,(Regular Expression,在代码中常简写为regex、regexp或RE),是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。
一、正则表达式是什么?
正则表达式最初是科学家对人类神经系统的工作原理的早期研究,现在在编程语言中有广泛的应用。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
二、正则概念
1.正则表达式的作用
给定的字符串是否符合正则表达式的过滤逻辑(匹配)
可以通过正则表达式,从字符串中获取我们想要的特定部分(提取)
强大的字符串替换能力(替换)
2.正则表达式的特点
灵活性、逻辑性和功能性非常的强
可以迅速地用极简单的方式达到字符串的复杂控制
对于刚接触的人来说,比较晦涩难懂
三、正则的组成
1.特殊字符
普通数字,字母,中文,符号,特殊字符......
2.常用元字符
\d:匹配至少有一个数字
\D:匹配至少任意一个非数字的字符
\w:匹配至少一个字母或数字或下划线
\W:匹配至少有一个不是字母,数字,下划线
\s:匹配至少任意的空白符
\S:匹配至少一个不是空白符的字符
.:匹配至少有一个非换行符
^:表示匹配行首的文本(以谁开始) ^\d
$:表示匹配行尾的文本(以谁结束)\d$
3.限定符
*:重复零次或更多次\d* /^ab*$/:表示一个字符串有一个a后面跟着零个或若干个b。("a", "ab", "abbb",……);
+:重复一次或更多次\d+ / ab+/:表示一个字符串有一个a后面跟着至少一个b或者更多;
?:重复零次或一次 /^ab?$/:表示一个字符串有一个a后面跟着零个或者一个b;
{n}:确定的次数,重复n次
{n,}:重复n次或更多次
{n,m}:重复n到m次
4.其他符号
[] :字符串用中括号括起来,表示匹配其中的任一字符,相当于或的意思 [0-9]
[^] :匹配除中括号以内的内容
\ 转义符: \的用法 \ 主要是用法是在正则表达式中的特殊符号转换为它本身的意思
| 或者,选择两者中的一个。注意|将左右两边分为两部分,而不管左右两边有多长多乱
() :从两个直接量中选择一个,分组
例如:gr(a|e)y匹配gray和grey
[\u4e00-\u9fa5] 匹配汉字
四、创建正则对象
字面量创建:var reg1 = /\d/;
构造函数创建: var regObj1 = new RegExp(/\w/);
正则匹配:语法:regexObj.test(str) test()方法
正则提取:语法:str.match(regexp) match()方法
正则替换:语法:str.replace(regexp|substr, newSubStr|function) replace(1,2)方法