JAVA 代码点和代码单元

代码点指编码表(比如Unicode)中某个字符的代码值(数字),在Unicode标准中,代码点采用十六进制书写,书写时前面加U+,比如U+0041是字母A的代码点.
Unicode的代码点可以分为17个代码级别。第一个代码级别称为基本的多语言级别,代码点从U+0000到U+FFFF,其余16个附加级别,代码点从U+10000到U+10FFFF,其中包含了一些辅助字符。
UTF-16编码采用不同长度的编码表示所有的Unicode编码。基本的多语言级别,每个字符用16位表示;而辅助字符采用一对连续的代码单元进行编码。这样构成的编码值一定落入基本的多语言级别中空闲的2048字节内,通常成为替代区域。U+D800--U+DBFF用于第一个代码单元,U+DC00--U+DFFF用于第二个代码单元。

java中的代码单元指表示编码表字符的最小存储单元,用16位表示

Unicode  U+0041 U+00DF U+6771 U+10400
表示字形
UTF-32 码单
00000041
000000DF
00006771
00010400
UTF-16 码单
0041
00DF
6771
D801 DC00
UTF-8 码单
41
C3 9F
E6 9D B1
F0 90 90 80
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值