先来了解什么是Unicode和一些概念?
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
codepoint 代表特定字符的数字。例如 0x3c0 是 π codepoint
[quote]
int s = 0x3c0;
System.out.println((char)s);
输出:π
[/quote]
Tiger之前的Java版本支持Unicode 3.0,所有Unicode字符容于16位(也就是一个char),而Tiger改为支持Unicode4.0(大部分新字符是汉字),它定义了不能容于16位的字符,这些字符不能容于一个char,这时我们用int类型的codePoint来表示该字符。如Character类的一些新方法支持..
[quote]
Tiger之前
Character.toLowerCase(char ch)
Tiger(多了支持传codepoint的方法)
Character.toLowerCase(int codePoint)
[/quote]
PS:是不是有写中文字在Tiger之前,不能放在char型中,在Tiger可以放在int型来实现。
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
codepoint 代表特定字符的数字。例如 0x3c0 是 π codepoint
[quote]
int s = 0x3c0;
System.out.println((char)s);
输出:π
[/quote]
Tiger之前的Java版本支持Unicode 3.0,所有Unicode字符容于16位(也就是一个char),而Tiger改为支持Unicode4.0(大部分新字符是汉字),它定义了不能容于16位的字符,这些字符不能容于一个char,这时我们用int类型的codePoint来表示该字符。如Character类的一些新方法支持..
[quote]
Tiger之前
Character.toLowerCase(char ch)
Tiger(多了支持传codepoint的方法)
Character.toLowerCase(int codePoint)
[/quote]
PS:是不是有写中文字在Tiger之前,不能放在char型中,在Tiger可以放在int型来实现。