码元与码点
JavaScript字符串使用了两种Unicode编码混合的策略:UCS-2和UTF-16。对于可以菜哦也能够16位编码的字符(U+0000~U+FFFF),这两种编码实际上是一样的。(《JavaScript高级程序设计》)
关于码元和和码点,通过一个例子进行介绍。

如图,字符串'😊'只有一个“笑脸”符号,但是通过length属性发现,“长度”为2,string.length到底表示什么?答:码元的个数
什么是码元?码元就是编码的最小单元,UTF-16和UCS-2的码元为16个比特(2字节)。也就是说,'😊'使用了两个码元,也就是4字节进行编码。
通过string.charCodeAt(index)方法可以返回对应位置的码元。

本文介绍了JavaScript中字符串采用的Unicode编码策略,重点讨论码元和码点的概念。码元是编码的最小单元,UTF-16的码元为2字节,而码点是字符的编码。通过`charCodeAt`、`charAt`、`codePointAt`等方法,可以操作码元和码点。举例说明了UTF-16编码规则,并解释了如何从码点转换为码元。
最低0.47元/天 解锁文章
378

被折叠的 条评论
为什么被折叠?



