ES6 字符串和正则表达式(三)

最新推荐文章于 2023-08-02 09:25:29 发布

小李看前端

最新推荐文章于 2023-08-02 09:25:29 发布

阅读量151

点赞数

分类专栏： ES6学习文章标签： javascript es6 es6/es7

本文链接：https://blog.csdn.net/lzDevastator/article/details/108450282

版权

ES6学习专栏收录该内容

25 篇文章 0 订阅

订阅专栏

更好的Unicode支持

早期，由于存储空间宝贵，Unicode使用16位二进制来存储文字。我们将一个16位的二进制编码叫做一个码元（Code Unit）。

后来，由于技术的发展，Unicode对文字编码进行了扩展，将某些文字扩展到了32位（占用两个码元），并且，将某个文字对应的二进制数字叫做码点（Code Point）。

ES6为了解决这个困扰，为字符串提供了方法：codePointAt，根据字符串码元的位置得到其码点。

同时，ES6为正则表达式添加了一个flag: u，如果添加了该配置，则匹配时，使用码点匹配

const text = "𠮷"; //占用了两个码元（32位）

console.log("字符串长度：", text.length);
console.log("使用正则测试：", /^.$/u.test(text));
console.log("得到第一个码元：", text.charCodeAt(0));
console.log("得到第二个码元：", text.charCodeAt(1));

//𠮷：\ud842\udfb7
console.log("得到第一个码点：", text.codePointAt(0));
console.log("得到第二个码点：", text.codePointAt(1));

/**
 * 判断字符串char，是32位，还是16位
 * @param {*} char 
 */
function is32bit(char, i) {
    //如果码点大于了16位二进制的最大值，则其是32位的
    return char.codePointAt(i) > 0xffff;
}

/**
 * 得到一个字符串码点的真实长度
 * @param {*} str 
 */
function getLengthOfCodePoint(str) {
    var len = 0;
    for (let i = 0; i < str.length; i++) {
        //i在索引码元
        if (is32bit(str, i)) {
            //当前字符串，在i这个位置，占用了两个码元
            i++;
        }
        len++;
    }
    return len;
}

console.log("𠮷是否是32位的：", is32bit("𠮷", 0))
console.log("ab𠮷ab的码点长度：", getLengthOfCodePoint("ab𠮷ab"))

3-3. [扩展]正则中的粘连标记

标记名：y

含义：匹配时，完全按照正则对象中的lastIndex位置开始匹配，并且匹配的位置必须在lastIndex位置。

const text = "Hello World!!!";

const reg = /W\w+/y;
reg.lastIndex = 3;
console.log("reg.lastIndex:", reg.lastIndex)
console.log(reg.test(text))

模板字符串

ES6之前处理字符串繁琐的两个方面：

多行字符串
字符串拼接

在ES6中，提供了模板字符串的书写，可以非常方便的换行和拼接，要做的，仅仅是将字符串的开始或结尾改为 ` 符号

如果要在字符串中拼接js表达式，只需要在模板字符串中使用${JS表达式}

3-5. [扩展]模板字符串标记

在模板字符串书写之前，可以加上标记:

标记名`模板字符串`

标记是一个函数，函数参数如下：

参数1：被插值分割的字符串数组

后续参数：所有的插值

let love1 = "秋葵";
let love2 = "香菜";

let text = `老李喜欢${love1}
阿忠也喜欢${love2}
表达式可以是任何有意义的数据${1 + 3 * 2 / 0.5}
表达式是可以嵌套的：${`表达式中的模板字符串${love1 + love2}`}
\n\n
········
在模板字符串中使用\${JS表达式}可以进行插值
`;

console.log(text);

小李看前端

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
ES6 字符串和正则表达式(三)

更好的Unicode支持早期，由于存储空间宝贵，Unicode使用16位二进制来存储文字。我们将一个16位的二进制编码叫做一个码元（Code Unit）。后来，由于技术的发展，Unicode对文字编码进行了扩展，将某些文字扩展到了32位（占用两个码元），并且，将某个文字对应的二进制数字叫做码点（Code Point）。ES6为了解决这个困扰，为字符串提供了方法：codePointAt，根据字符串码元的位置得到其码点。同时，ES6为正则表达式添加了一个flag: u，如果添加了该配置，则匹配时，使用码
复制链接

扫一扫