java 代码单元 代码点_关于Java代码点和代码单元

标签:

java char类型是16位的(UTF-16编码),它不能满足所有unicode字符的编码,java代码点是指某个字符对应的unicode编码值,如A字符的unicode代码点就为u+0041。代码点的数量其实也就是unicode字符的数量。

每个char变量其实就是一个代码单元,一个字符一般对应一个代码单元或者多个代码单元。

字符串的length方法返回的是代码单元的数量(注意,不是字符数量),而codePointCount方法返回则是代码点的数量,也就是unicode字符数量。

在编译java源代码的时候,javac的-encoding选项可以指定源代码字符文件使用的编码,因为如果不加这个选择,javac会选择一种默认的编码假定为源文件的编码,但是如果假定的编码和文件实际编码不匹配则不能编译通过。在很多代码场景下,和编码相关的操作都牵扯默认编码,所以不要依赖默认编码,在代码中指明一个流的编码总是对的。

标签:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值