码点与代码单元

码点与代码单元

码点

码点是指与一个编码表中的某个字符对应的代码值。
在Unicode标准中,码点采用16进制书写,并加上U+,例如U+0041就是拉丁字母A的码点。

代码单元

UTF-16编码采用不同长度的编码表示所有Unicode码点,在基本多语言平面,每个字符用16位表示,通常称为代码单元

char数据类型是一个采用UTF-16编码表示Unicode码点的代码单元。最常用的Unicode字符使用一个代码单元就可以表示。

public class CodePoint {
    public static void main(String[] args) {
        String greeting = "Hello";
        
        System.out.println(greeting.length());
        //length方法返回采用UTF-16编码表示给定字符串需要的代码单元数量
        
        System.out.println(greeting.codePointCount(0,greeting.length()));
        //要想得到实际的长度,即码点数量,使用codePointCount方法
        
        System.out.println(greeting.offsetByCodePoints(0,2));
        //得到第2个码点的索引
        
         System.out.println(greeting.codePointAt(greeting.offsetByCodePoints(0,2)));
        //使用codePointAt得到码点,返回值类型为int
    }
}

结果

5
5
2
108

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值