ES6正则的扩展

最新推荐文章于 2022-03-29 17:10:34 发布

ManGoYi

最新推荐文章于 2022-03-29 17:10:34 发布

阅读量218

点赞数

分类专栏： ECMAScript6

本文链接：https://blog.csdn.net/mangoyiy/article/details/79557554

版权

ECMAScript6 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

1 RegExp构造函数
在ES5中，RegExp构造函数的参数有两种情况：
第一种情况：参数是字符串，第二个参数表示正则表达式的修饰符(flag)

var regex = new RegExp("xyz", "i");
// 等价于
var regex = /xyz/i;      //  /xyz/i

第二种情况：参数是一个正则表达式，直接表示正则表达式

var regex = new RegExp(/xyz/i);
// 等价于
var regex = /xyz/i;      //  /xyz/i

ES5不允许此时使用第二个参数添加修饰符

var regex = new RegExp(/xyz/, 'i');
// Uncaught TypeError: Cannot supply flags when constructing one RegExp from another

ES6改变了这种行为。如果RegExp构造函数第一个参数是一个正则对象，那么可以使用第二个参数指定修饰符。而且，返回的正则表达式会忽略原有的正则表达式的修饰符，只能使用新指定的修饰符

new RegExp(/abc/ig, 'i').flags
// "i"

2 u 修饰符
ES6对正则表达式添加了u修饰符，含义是”Unicode模式”，用来正确处理大于\uFFFF的Unicode字符。
（1）点（.）字符在正则表达式中，含义是出了换行符以外的任意单个字符。对于码点大于0xFFFF的Unicode字符，点字符不能识别，必须加上u修饰符。

var s = '��';

/^.$/.test(s)          // false
/^.$/u.test(s)         // true

代码表示，如果不添加u修饰符，正则表达式就会认为字符串为两个字符，从而匹配失败。
（2）Unicode字符表示法
ES6新增了使用大括号标识Unicode字符，这种表示法在正则表达式中必须加上u修饰符，才能识别当中的大括号，否则会被解读为量词

/\u{61}/.test('a')      // false
/\u{61}/u.test('a')     // true

代码表示，如果不加u修饰符，正则表达式无法识别\u{61}这种表示法，只会认为这匹配61个连续的u。
（3）预定义模式
u修饰符影响到预定义模式，能否正确识别码点大于0xFFFF的Unicode字符。

/^\S$/.test('��')      // false
/^\S$/u.test('��')         // true

利用此模式，写出一个正确返回字符串长度的函数

function codePointLength(text) {
  var result = text.match(/[\s\S]/gu);
  return result ? result.length : 0;
}

var s = '����';

s.length                // 4
codePointLength(s)      // 2

3 y 修饰符
ES6还为正则表达式添加了y修饰符，叫做”粘连”（sticky）修饰符。
y修饰符的作用与g修饰符类似，也是全局匹配，后一次匹配都从上一次匹配成功的下一个位置开始。不同之处在于，g修饰符只要剩余位置中存在匹配就可，而y修饰符确保匹配必须从剩余的第一个位置开始，这也就是”粘连”的含义。

var s = 'aaa_aa_a';
var r1 = /a+/g;
var r2 = /a+/y;

r1.exec(s) // ["aaa"]
r2.exec(s) // ["aaa"]

r1.exec(s) // ["aa"]
r2.exec(s) // null

以上有两个正则表达式，一个使用g修饰符，一个使用y修饰符。这两个正则表达式各执行了两次，第一次执行的时候，两者行为相同，剩余的字符串都是_aa_a。由于g修饰符没有位置要求，所以第二次执行会返回结果。而y修饰符要求匹配必须从头部开始，所以返回null。
单单一个y修饰符对match方法，只能返回第一个匹配，必须与g修饰符联用，才能返回所有匹配。

'a1a2a3'.match(/a\d/y)          // ["a1"]
'a1a2a3'.match(/a\d/gy)         // ["a1", "a2", "a3"]

4 sticky属性
与y修饰符相匹配，ES6的正则对象多了sticky属性，表示是否设置了y修饰符。

var r = /hello\d/y;
r.sticky                    // true

5 flags属性
ES6为正则表达式新增了flags属性，会返回正则表达式的修饰符。

// ES5 的 source 属性
// 返回正则表达式的正文
/abc/ig.source
// "abc"

// ES6 的 flags 属性
// 返回正则表达式的修饰符
/abc/ig.flags
// 'gi'

6 s 修饰符：dotAll模式
正则表达式，点（.）是一个特殊字符，代表任意的单个字符。但是有两个除外，一个是四个字节的字符，这个可以使用u修饰符解决。另一个是行终止符。
“行终止符”：
U+000A 换行符（\n）
U+000D 回车符（\r）
U+2028 行分隔符（line separator）
U+2029 段分隔符（paragraph separator）

/foo.bar/.test('foo\nbar')

// false

上面的代码中，因为.不匹配\n，所以正则表达式返回false
所以在ES2018中引入s修饰符，是的.可以匹配任意单个字符。注意：基本上现在的浏览器都识别不了，毕竟ES2018的提案

/foo.bar/s.test('foo\nbar') 

// true

这种称为dotAll模式，即点（dot）代表一切字符。所以，正则表达式还引入了一个dotAll属性，返回一个布尔值，表示该正则表达式是否处在dotAll模式。

const re = /foo.bar/s;

re.test('foo\nbar') // true
re.dotAll           // true
re.flags            // 's'

本博客内容摘抄自
阮一峰老师写的ECMAScript6入门一书

ManGoYi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ES6正则的扩展

1 RegExp构造函数在ES5中，RegExp构造函数的参数有两种情况：第一种情况：参数是字符串，第二个参数表示正则表达式的修饰符(flag)var regex = new RegExp("xyz", "i");// 等价于var regex = /xyz/i; // /xyz/i第二种情况：参数是一个正则表达式，直接表示正则表达式var regex = n...
复制链接

扫一扫