更好的Unicode支持
早期由于存储空间宝贵,Unidode使用16位二进制来存储文字。我们将一个16位的二进制编码叫做一个码元( Code Unit )
后来,由于技术的发展,Unicode对文字编码进行了扩展,将某些文字扩展到了32位( 占用两个码元), 并且,将某个文字对应的二进制数字叫做码点( Code Point )
ES6以前都是用码元来计算的,这就导致每个汉字会占用两个码元,因此有些方法匹配不到
ES6 新增方法,codePointAt()返回字符串码点
同时ES6 为正则表达式添加了一个判断
:u; 以码点进行匹配
更多的字符串API
字符串原型上的方法:
includes
判断字符传中是否包含指定的字符;
str,inclides(" 0 ", 5 ) 判断str中是否有”0“,从索引位5开始查起,不写,默认从0开始;
startWith
是否以指定的开始
endsWith
是否已指定的结束
str.endsWith(“s”,str.length) 第二个参数为查询字符串长度,不写默认为str.length
repeat
将字符串重复相应的次数,并返回新的字符串;
str.repeat(4)
正则中的粘连标记
标记名:y
含义匹配时,完全按照正则对象中的lastIndex位置开始匹配并且匹配的位置必须在lastIndex位置
什么意思呢?我们看个例子:
模板字符串
ES6之前处理字符串繁琐的两个方面:
- 多行字符串
- 字符串拼接
在ES6,提供了两种模板字符串的书写,方便我们换行和拼接,我们不再使用引号,而是使用 ` 这个符号
拼接时,我们是使用 ${ js表达式 },并且可以嵌套
模板字符串标记
标记:在模板字符串书写前可以加上标记:
标记名 ` 模板字符串`
标记是一个函数,用来处理米板字符串,参数如下:
- 参数一:被插值( ${xxx})分割的字符串数组;
- 后续参数 : 所有的插值
String.raw ES6自带模板字符串标记函数,识别转义字符,将转义符变成普通字符,比如: