js中创建正则表达式的方法有两种
let re = /^\d{3}\-\d{3,8}$/;// /正则表达式/
let res = new RegExp('/^\d{3}\-\d{3,8}$/');
一种是变量直接命名正则表达式,另外一种是创建RegExp对象。
正则表达式的内容非常庞大,它最常用来匹配我们的字符串。
正则表达式的基本组成元素可以分为:字符和元字符
字符:就是基础的计算机字符编码,通常正则表达式里面使用的就是数字、英文字母。
元字符:也被称为特殊字符,是一些用来表示特殊语义的字符。如^表示非,|表示或等。利用这些元字符,才能构造出强大的表达式模式(pattern)。
对于最简单的正则表达式,由简单的数字和字母组成即可,没有特殊的语义(无须元字符),纯粹就是一一对应的关系。如想在apple这个单词里找到a这个字符,就直接用/a/这个正则就可以。
下面介绍一下正则表达式常用的元字符:
\d 主要用来匹配数字 如 '00\d'可以用来匹配'008',\w用来匹配一个字母或者数字,^匹配行以谁开始,
$匹配行的结束,
\s匹配任意空白字符,
\ 转义字符:将下一个字符标记为一个特殊字符、或一个原义字符、或一个 向后引用、或一个八进制转义符。
常用的反义元字符:
[^x]匹配除了x以外的任意字符,[^xy]匹配除了xy字母以外的任意字符,[^a-z]匹配除了字母a-z以外的任意字符。
\B 匹配不是单词开头或结束的位置
\D 匹配任意不是数字的字符
\S 匹配任意不是空白符的字符
\W 匹配任意不是字母,数字,下划线的字符([^0-9a-zA-Z_])
正则表达式连接符:
[0-9]匹配数字,等价于\d
[a-z]匹配英文小写字母
[A-Z]匹配英文大写字母
[0-9a-zA-Z]匹配数字或英文字母
修饰符:
g: global 全文搜索,不添加,搜索到第一个匹配停止
i: ignore case 忽略大小写,默认大小写敏感
m: multiple lines 多行搜索
常用重复限定元字符:
? 重复0次或1次(n?匹配0个或1个n 的字符串)
+ 重复1次或n次(n+匹配1个或n个n 的字符串)
* 重复0次或n次(n*匹配0个或n个n 的字符串)
{n} 重复n次
{n,} 重复n次或更多次( 至少n次)
{n,m} 重复n到m次({min, max}介于min次到max次之间)
用法:
切割字符串:
let str = '55 56 57';
console.log(str.split(''));//正常切割不会区分空格
console.log(str.split(/^\s/));//用正则表达式切割区分空格
分组
除了简单地判断是否匹配之外,正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组(Group)
比如:
^(\d{3})-(\d{3,8})$分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码:
let re = /^(\d{3})-(\d{3,8})$/;
console.log(re.exec('010-23654'));//['010-23654', '010', '23654', index: 0, input: '010-23654', groups: undefined]
如果正则表达式中定义了组,就可以在RegExp对象上用exec()方法提取出子串来。
exec()方法在匹配成功后,会返回一个Array,第一个元素是正则表达式匹配到的整个字符串,后面的字符串表示匹配成功的子串。
exec()方法在匹配失败时返回null。
贪婪匹配:
需要特别指出的是,正则匹配默认是贪婪匹配,也就是匹配尽可能多的字符。举例如下,匹配出数字后面的0:
let re = /^(\d+)(0*)$/;
console.log(re.exec('10000'));//['10000', '10000', '', index: 0, input: '10000', groups: undefined]
由于\d+采用贪婪匹配,直接把后面的0全部匹配了,结果0*只能匹配空字符串了。必须让\d+采用非贪婪匹配(也就是尽可能少匹配),才能把后面的0匹配出来,加个?就可以让\d+采用非贪婪匹配。