ES6加强了对 Unicode 的支持,并且扩展字符串对象。
字符的 Unicode 表示法
JavaScript允许采用 \uxxxx 形式表示一个字符,其中 xxxx 表示字符的 Unicode 码点。
1)字符串与 Unicode 编码的相互转换
'你好'.charCodeAt(0).toString(16)
//'4f60'
上面代码将字符串‘你好’,转化为 Unicode 编码,
'你好'.charCodeAt(0).toString(16)
// '4f60'
'你好'.charCodeAt(1).toString(16)
// '597d'
charCodeAt() 方法可返回指定位置的字符的 Unicode 编码,这个返回值是 0~ 65535 之间的整数。toString() 就是将字符串转化为 16 进制了。
上面代码块的第二行中,实际输出的是字符串'好'的 Unicode 编码,因此如果你想知道单个字符串的编码,就是靠charCodeAt()里面的参数,也就是索引查看。
'\u597d'
// 好
要是想把 Unicode 解码成字符就要用转义字符 '\u'
2)根据上文表示法,只限于码点在 '\u0000' - '\uffff' 之间的字符,如果超出这个范围,就必须用双字节的形式表示。
'\uD842\uDFB7'
//