java代码单元和代码点的区别

String可以定义为一个不可变库例程中的一个预定义的一个类

不可变:是指一个String的对象是不容修改的,如:String g = "Hello"; 想变为“Help”,只能让g引用另外一个String对象,而“Hello”会被回收,这看起来效率比较低,但是Java的字符串是可以共享的。

库类:是指Java中没有内置的字符串类型。String是库例程中的一个预定义的一个类

一些常见的操作在java.lang.String可以找到,不一一讲解。

有关代码单元和代码点的理解:

Char: 在java中是采用UTF-16编码的,也就是说,Char是代表一个字符单元。

代码单元:UTF-8中是用8个字节表示的,UTF-16中使用16个字节表示的等等。

代码点:对应各种真正字符(char不是真正的字符,是代码单元)的Unicode编码。

一个代码点可能对应一对代码单元,如辅助字符。

也正是因为以上原因,在Java中,不赞成使用Char类型,因为它并不能代表一个真正的字符,而只是代码单元,而操作中,我们往往想得到的是真正的字符,而不是代码单元char。

当然,一般我们很少遇到辅助字符(由两个代码单元组成),但还是有必要了解一下。

具体操作及区别:

String test = "Hello";

长度:test.Length();   //返回代码单元的数量

       test.codePointCount(0,test.Length());//0-length单元之间,返回代码点的数量

字符

    test.charAt(i);  //返回第i个代码单元

Int index = test.offByCodePoint(0,i); //返回第i个代码点的专用索引

test.codePointAt(index);             //返回第i个代码点

便利字符串真正字符:

Int cp = test.codePointAt(i);

If(Character.isSupplementaryCodePoint(cp)) i += 2;  //判断是否是辅助字符

Else i++;

char:java中,char类型为16位,原本用于表示一个字符。但是后来发现,16位已经不够表示所有的字符,所以后来发展出了用代码点表示字符的方法。

代码点:是指编码字符集中,字符所对应的数字。有效范围从U+0000到U+10FFFF。其中U+0000到U+FFFF为基本字符,U+10000到U+10FFFF为增补字符

代码单元:对代码点进行编码得到的1或2个16位序列(UTF-16)。其中基本字符的代码点直接用一个相同值的代码单元表示,增补字符的代码点用两个代码单元进行编码,编码值来自U+D800到U+DFFF,这个范围内没有数字用于表示字符,因此程序可以识别出当前字符是单单元基本字符,还是双单元增补字符

 

复制代码
 1 public class HelloBunny
 2 {
 3    public static void main(String[] args)
 4    {
 5       String sentence = "\u03C0 \uD835\uDD6B";
 6       int lengthU = sentence.length();
 7       int lengthP = sentence.codePointCount(0, lengthU);
 8       System.out.println(lengthU);        // 4个code units
 9       System.out.println(lengthP);        // 3个code points
10       
11       int i = sentence.codePointAt(2);    // i=2 true  i=0,1,3 false  i=4 out of bound
12       boolean b = Character.isSupplementaryCodePoint(i);
13       System.out.println(b);      
14    }
15 } 

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值