javaScript正则表达式

目录

1. 正则表达式是什么?

2. 正则表达式的创建

字面量创建

构造函数创建

3. 字符类型

普通字符

特殊字符

模式修饰符

4. 正则表达式的实例方法

exec()

test()

toString()/toLocaleString()

valueOf()

5. 正则表达式的实例属性

lastIndex

ignoreCase、global、multiline

source

6. 正则表达式的字符

直接量字符

字符集合

字符类

边界符

7. 数量词

8. 选择、分组、引用

选择

分组

引用

9. 前瞻表达式


正则表达式(Regular Expression,代码中简写regex、regexp或RE)

使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。

注:本文章只列举常用方法,并不齐全。

1. 正则表达式是什么?

  • 由一个字符序列形成的搜索模式。
  • 在文本中搜索数据时,用搜索模式来描述需要查询的内容。
  • 可以是一个简单的字符,或者是一个复杂的字符序列。
  • 可用于所有文本搜索和文本替换的操作。

2. 正则表达式的创建

  • 字面量创建

//在一对反斜线中写正则表达式内容    字符串类型不需要加引号''
var reg = /正则表达式/修饰符;
var reg = /Hello/g;
  • 构造函数创建

//构造正则表达式的实例
//内部传入的参数为字符串/字符串的变量
var reg =new RegExp("正则表达式","修饰符")    //修饰符可省略
var reg =new RegExp("hello","g");

3. 字符类型

  • 普通字符

        字母(大小写)、数字(0-9)、下划线(_)、

        汉字(陈、梁、黄等)、没有特殊含义的符号(,;!@%等)

  • 特殊字符

        /        将特殊字符转义成普通字符

        .        匹配任何字符(除了\n和回车之外)

        ^        匹配字符串起始部分

        $        匹配字符串终止部分

        *        匹配 0 次或者多次前面出现的正则表达式

        +        匹配 1 次或者多次前面出现的正则表达式

        ?        匹配 0 次或者 1 次前面出现的正则表达式

  • 模式修饰符

        i        ignoreCase,匹配时忽视大小写

        m        multiline,多行匹配

        g        global,全局匹配

4. 正则表达式的实例方法

  • exec()

用来匹配字符串中符合正则表达式的字符串

        返回值:匹配到返回数组。

        [匹配的内容,index: 在str中匹配的起始位置,input: 参数字符串,groups: undefined

        否则null

// 基础用法
var str = 'hello html hello java';
var reg = /hello/;
console.log(reg.exec(str));    //[ 'hello', index: 0, input: 'hello world hello', groups: undefined ]

// 全局模式正则验证,可循环输出    lastIndex会记录上一次的搜索位置
var reg = /hello/g;    // g 修饰符:全局模式的验证
while(true)
	var result = reg.exec(str);
	if(!result){
		break;
	}
	console.log(result[0],result["index"],reg.lastIndex);
}

注意点:

  1. 如果正则表达式中有修饰符“g”,lastIndex属性会记录上一次结束的位置,当第二次执行exe的时候,从lastIndex开始检索。
  2. 如果正则表达式中没有修饰符“g”,不会维护lastIndex属性,每次执行从开始位置检索。
  • test()

用来搜索字符串中是否有可以匹配到正则表达式的字符串

        返回值:true/false

var str = 'hello world';
var reg1 = /hello/;
var reg2 = /work/;
console.log(reg1.test(str)); //true
console.log(reg2.test(str)); //false

注意点与exec()的相同

  • toString()/toLocaleString()

把正则表达式的内容转化成字面量形式字符串/有本地特色的字符串(JS中没效果)

var reg = /hello/;
console.log(reg.toString()); //     /hello/ String类型
console.log(reg.toLocaleString()); //     /hello/ String类型
  • valueOf()

返回正则表达式本身

var reg = /hello/;
console.log(reg.valueOf());  //    /hello/

5. 正则表达式的实例属性

  • lastIndex

当没设置全局匹配(“g”)时,值始终为0

当设置了全局匹配(“g”)时,每执行一次exec()/test(),lastIndex就会移向匹配到的字符串的下一个位置,当指向的位置后没有可以再次匹配的字符串时,下一次执行exec返回null / test执行返回false,然后lastIndex归零,从字符串的开头重新匹配一轮

// 没有设置全局
var str = 'hello hello hello';
var reg1 = /hello/;
console.log(reg1.lastIndex);  // 0
console.log(reg1.exec(str));  // 返回第一个hello
console.log(reg1.lastIndex);  // 0

// 设置了全局
var reg2 = /hello/g;
console.log(reg2.lastIndex);  // 0
console.log(reg2.exec(str));  // 返回第一个hello
console.log(reg2.lastIndex);  // 5

console.log(reg2.exec(str));  // 返回第二个hello
console.log(reg2.lastIndex);  // 11

console.log(reg2.exec(str));  // 返回第三个hello
console.log(reg2.lastIndex);  // 17

console.log(reg2.exec(str));  //返回 null

console.log(reg2.lastIndex);  // 0
console.log(reg2.exec(str));  // 返回第一个hello
console.log(reg2.lastIndex);  // 5
  • ignoreCase、global、multiline

判断正则表达式中是否有忽略大小写全局匹配多行匹配三个模式修饰符

var reg = /hello/igm;    // i 忽略大小写    g 全局匹配    m 多行匹配
console.log(reg.ignoreCase); //true
console.log(reg.global); //true
console.log(reg.multiline);  //true
  • source

返回字面量形式的正则表达式(类似于toString

var reg = /hello/g;
console.log(reg.source); //hello

6. 正则表达式的字符

  • 直接量字符

正则表达式中的所有字母和数字都是按照字面含义进行匹配的

Javascript正则表达式语法也支持特殊的字符匹配,通过反斜线\进行转义。

字符匹配
普通字符(字母、数字、下划线等)自身
\oNull 字符
\t制表符
\n换行符
\v垂直制表符
\f换页符
\r回车符
  • 字符集合

  1. 一个字符集合,也叫字符组。如( [abc]、[qwd] 等)
  2. 用连字符 ‘-’ 指定一个范围。如 ( [0-9]、[a-z]、[5-8] 等)
  3. ^写在[]里面是反义字符组,指匹配任意不在括号内的字符。如 ( [^3-6]、[^abz] 等)
  4. 匹配集合中的任意一个字符。
  • 字符类

字符类含义
.匹配除换行符\n和回车符之外的任何单个字符,等效于[^\n\r]
\d匹配一个数字字符,等效于[0-9]
\D[^0-9]
\w匹配A~Z,a~z,0~9和下划线"_"中任意字符,等效于 [a-zA-Z0-9_]
\W[^a-zA-Z0-9_]
\s匹配任何Unicode空白字符,包括空格、制表符、换页符等,等效于[\f\t\n\r]
\S[^\f\t\n\r]
  • 边界符

^        匹配输入开始。表示匹配行首的文本(以谁开始)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。

$        匹配输入结尾。表示匹配行尾的文本(以谁结束)。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符前的结尾处。

字符集合与"^"和"$"一起使用        表示必须是精确匹配。

var reg1 = /abc/; 
// /abc/ 只要包含有abc这个字符串返回的都是true
console.log(reg1.test('abc'));  //true
console.log(reg1.test('abcd')); //true
console.log(reg1.test('aabcd'));//true
console.log('---------------------------');
// 必须是以abc开头的字符串才会满足
var reg2 = /^abc/;
console.log(reg2.test('abc')); // true
console.log(reg2.test('abcd')); // true
console.log(reg2.test('aabcd')); // false
console.log('---------------------------');
// 必须是以abc结尾的字符串才会满足
var reg3 = /abc$/;
console.log(reg3.test('abc')); // true
console.log(reg3.test('qweabc')); // true
console.log(reg3.test('aabcd')); // false
console.log('---------------------------');
var reg4 = /^abc$/; // 精确匹配 要求必须是 abc字符串才符合规范
console.log(reg4.test('abc')); // true
console.log(reg4.test('abcd')); // false
console.log(reg4.test('aabcd')); // false
console.log(reg4.test('abcabc')); // false

\b        匹配一个零宽单词边界,表示一个单词(而非字符)边界,也就是单词和空格之间的位置,或者字符(\w)与字符串开头或者结尾之间的位置。

\B        匹配一个零宽非单词边界,与"\b"相反。

var str = 'Hello World Hello JavaScript';
var reg1 = /\bWorld\b/g;
var reg2 = /\BScrip\B/g;
console.log(reg1.test(str));    // true
console.log(reg2.test(str));    // true

7. 数量词

字符含义
*>=0 次  等价于 {0,}
+≥1 次  等价于  {1,}
?0或1 次  等价于  {0,1}
{n}n 次
{n,}>=n 次
{m,n}m到n 次
// * 允许出现1次或多次
var reg = new RegExp(/^a+$/);
console.log(reg.test("a"));     // true
console.log(reg.test(""));     // false

// {3,} 至少出现3次
var reg1 = new RegExp(/^a{3,}$/);
console.log(reg1.test("a"));     // false
console.log(reg1.test(""));     // false
console.log(reg1.test("aaa"));     // true

8. 选择、分组、引用

  • 选择

字符"|"用于分隔供选择的字符,选择项的尝试匹配次序是从左到右,直到发现了匹配项。

var reg = /html|css|javascript/
console.log(reg.exec('qweqwehtml123css'));     // html
  • 分组

圆括号包裹的一个小整体成为分组。

var reg = /abcabcabc/;
等价于
var reg = /(abc){3}/;

候选:一个分组中,可以有多个候选表达式,用 | 分隔。

var reg = /Hello (html|css|javascript)/;
console.log(reg.test('Hello html'));     //true
console.log(reg.test('Hello css'));     //true
console.log(reg.test('Hello javascript'));     //true

捕获与引用:被正则表达式匹配到的字符串会被暂存起来。分组捕获的串会从1开始编号。

var reg = /(\d{4})-(\d{2})-(\d{2})/;
var date = '2021-08-31';
reg.test(date);
// 捕获之前要先test()/exec()
console.log(RegExp.$1);     //2021
console.log(RegExp.$2);     //08
console.log(RegExp.$3);     //31

嵌套分组的捕:以左括号出现的顺序进行捕获。

var reg = /((apple) is (a (fruit)))/;
var str = "apple is a fruit";
reg.test(str); // true
console.log(RegExp.$1);     // apple is a fruit
console.log(RegExp.$2);     // apple
console.log(RegExp.$3);     // a fruit
console.log(RegExp.$4);     // fruit

  • 引用

可在正则表达式内容中用 “\” 引用分组的值。编号从1开始。

var reg = /(\w{3}) is \1/;    \1 等价于 (\w{3})
console.log(reg.test('abc is abc'));     // true

9. 前瞻表达式

表达式名称描述
(?=exp)正向前瞻匹配后面满足表达式exp的位置
(?!exp)负向前瞻匹配后面不满足表达式exp的位置

前瞻:

var str = 'Hello, Hi, I am Hilary.';
// 后面一定要匹配什么
var reg = /H(?=i)/g;    // H后面需要匹配i
var newStr = str.replace(reg, "T");
console.log(newStr);    //Hello, Ti, I am Tilary.

理解:在这个DEMO中我们可以看出正向前瞻的作用,同样是字符"H",但是只匹配"H"后面紧跟"i"的"H"。就相当于有一家公司reg,这时候有多名"H"人员前来应聘,但是reg公司提出了一个硬条件是必须掌握"i"这项技能,所以"Hello"就自然的被淘汰掉了。

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值