代码点和代码单元
这部分属于Unicode的范畴:Unicode是国际组织制定的可以容纳世界上所有文字和符号的字符编码方案。
在表示一个Unicode的字符时,通常会用“U+”然后紧接着一组十六进制的数字来表示这一个字符。具体的一些关于Unicode的知识可以查看链接点击打开链接
1、代码点是指可用于编码字符集的数字。
2、代码单元可以理解为字符编码的一个基本单元,最常用的代码单元是字节
3、对Java核心技术上这一节的程序解释如下:
package edu.hunnu.test;
/**
*本段Java代码用于解释核心技术相应章节上的
*程序
* @author Blue Jey
*
*/
public class String1 {
public static void main(String[] args) {
// TODO Auto-generated method stub
String temp="Hello Java";
//System.out.println(temp.substring(1,3));
System.out.println(temp.length());
int cpCount;//code point count 代码点计数
//codePointCount(begin,end)返回从begin到end的代码点数
cpCount=temp.codePointCount(0, temp.length());
System.out.println(cpCount);
//offsetByCodePoints(index,codepointOffset);返回(index+codepointOffset);
//offset 偏移量
int index=temp.offsetByCodePoints(2, 3);
System.out.println(index);
//codePointAt(index)返回在index代码点的字符对应的ASCAII码
int cp=temp.codePointAt(index);
System.out.println(cp);
}
/*本例的console输出:
10
10
5
32
*/
}
有什么写的不恰当的地方,欢迎大家多多指教,共同学习进步