代码点和代码单元

代码点:计算机处理字符时要将字符数字化,所以需要对字符进行编码。编码字符集中每个字符都与一个编号对应,我们将这个编号称为代码点。

代码单元:指一个已编码文本中具有最短比特组合的单元。使用UTF-8,代码单元为8比特;使用UTF-16,代码单元为16比特。
Unicode编码字符集有65536个字符,将这些字符表示成统一长度每个字符需要2个字节,即16比特,所以若使用UTF-8编码,每个字符需要2个代码单元;使用UTF-16编码,需要1个代码单元。

因此一串字符串代码点和代码单元数量可能不等。

String s = "Hello";

int n = s.length();  //得到的长度为代码单元数量
int cpCount = s.codePointCount(0, s.length()); //得到代码点数量,即实际长度

char a = s.charAt(n); //返回位置为n的代码单元
int index = s.offsetByCodePoins(0, n);
char cp = (char) s.codePointAt(index); //返回第n个代码点对应的字符
  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值