代码点与代码单元

最新推荐文章于 2021-06-12 09:33:58 发布

3G

最新推荐文章于 2021-06-12 09:33:58 发布

阅读量654

点赞数 1

分类专栏： java 文章标签： character string web开发 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/killfen/article/details/6999300

版权

java 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一个完整的Unicode字符叫代码点/CodePoint

代码点(CodePoint)：一个完整的Unicode叫代码点

代码单元(CodeUnit)：一个java char叫代码单元

Java的String对象是以UTF-16保存Unicode的字符，需要用2个字符表示一个超大字符集汉字，这种表示方式为Sruuogate，

第一个字符叫Surrogate High

第二个就是Surrogate Low

判断一个char是否是Surrogate区的字符，用Character的isHighSurrogate()/isLowSurrogate()方法。

从两个Surrogate High/Low字符，返回一个完整的Unicode CodePoint用Character.toCodePoint()/codePointAt()

一个代码点，可能需要一个也可能需要两个char表示，因此不能直接使用CharSequence.length()方法返回

一个字符串到底有多少个汉字，而需要用String.codePointCount()/Character.codePointCount()

要定位字符串中的第N个字符，不能直接将n作为偏移量，而需要从字符串头部依次遍历得到，需要String.offsetByCodePoints()

从字符串的当前字符，找到上一个字符，不能直接用offset实现，而需要String.codePointBefore()，或String.offsetByCodePoints()

从当前字符，找下一个字符，需要判断当前CodePoint的长度，再计算得到String.offsetByCodePoints()

举例：

String str = "web开发";

int len = str.length();

System.out.println(len);

//输出结果为5；

int cLen = str.codePointCount(0,str.length());

System.out.println(cLen );

//输出结果同样为5

//定位一个字符

char cp = str.charAt(4);

System.out.println(cp );

//输出为“发”；

int index = str.offsetByCodePoints(0,4);

int _cp = str.codePointAt(index);

System.out.println(_cp );

//输出为21457；

//原来是获取字符串中指定位置的字符的UNICODE值,其值等同于(int)charAt(i)

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
代码点与代码单元

一个完整的Unicode字符叫代码点/CodePoint代码点(CodePoint)：一个完整的Unicode叫代码点代码单元(CodeUnit)：一个java char叫代码单元Java的String对象是以UTF-16保存Unicode的字符，需要用2个字符表示一个超大字符集汉字，这种表示方式为Sruuogate，第一个字符叫Surrogate High第二个就是Surro
复制链接

扫一扫

专栏目录

3G CSDN认证博客专家 CSDN认证企业博客

码龄17年

14: 原创

65万+: 周排名

62万+: 总排名

1万+: 访问

: 等级

389: 积分

1: 粉丝

8: 获赞

3: 评论

6: 收藏

私信

关注

热门文章

分类专栏

cms 2篇
java cms 1篇
springboot cms 1篇
java开源cms 1篇
java 6篇
j2ee
j2me
linux 6篇
mysql 2篇
flex

最新评论

织梦java版本mcms，简单好用Java cms
dianer58cms: JavaDianerCMS内容发布系统采用流行的SpringBoot、freemarker、redis、mysql、shiro等，支持静态化、标签化建站。在这3年中，不断维护和迭代更新，已经形成无需后端修改，只要会html和freemarker即可建站，上手容易；只需使用系统提供的标签就能轻松建设网站。https://www.dianer58.com/htmls/other/20230630/1674675455637393408.html
织梦java版本mcms，简单好用Java cms
安生吖: 哇，终于看到有人发现了这款cms，差点以为整个csdn救我在用，这就是一个宝藏java类cms，这款开源产品真的有技术在群里实时解答，开源产品做到这样真的很不容易。
织梦java版本mcms，简单好用Java cms
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
织梦java版本mcms，简单好用Java cms
吴某人s: 这款cms是我用过比较好的，上手起来也比较快，可能也是因为对java比较熟悉接受度比较好，现在也在用，这款开源比较适合接点私活，生态还是不错的

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。