java的char类型

1 篇文章 0 订阅

码点:与一个编码表(例如Unicode)中某个字符对应的代码值
Unicode的码点有17个平面(可以理解为17类):基本多语言平面(U+0000 ~U+FFFF)以及其余16个平面(U+10000 ~U+10FFFF,包括辅助字符)
代码单元:实际编码时,采取的存储策略。对于Unicode的基本多语言平面的码点,UTF-16编码采用16位(即两个字节)表示每个字符,这两个字节就是代码单元。但是,对于辅助字符的编码,则为一对连续的代码单元(即四个字节)。
替代区域:基本多语言平面中的未用的2048个值(U+D800 ~U+DBFF和U+DC00 ~U+DFFF),前者用于第一代码单元,后者用于第二代码单元。这样的设计,可以使我们很容易知道,一个代码单元是一个基本字符的编码,还是一个辅助字符的第一或第二部分。
在java中,字符编码的单位就是一个代码单元(即两个字节),即使是辅助字符,也只是两个连续代码单元(即两个的“两个字节”,2 *2关系,而不是1 *4的关系)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值