目录
函数的使用
☀♫♪ 使用场景
举例:返回字符串s中的所有数字之和。易知s中的数字分别为{3,2,3,5,3,5,2,0},其和为23s = " f3@$23%5Q3Zh52=0" |
private static int NumbSum(String s){
int sum = 0;
char [] data = s.toCharArray();
for(int i = 0;i < data.length;i++){
if(Character.isDigit(data[i])){
sum += data[i] - '0';//将char数字转换为int
}
}
return sum;
}
☀♫♪ 实现结果
源码解析
挨个判断已转化为字符数组中的数据是否为数字是解题的关键,即必须理解的Character.isDigit(data[i])的实现过程。在解析源码之前需要掌握字符与数字之间的对应关系,在ASCII编码中,字符与数字的对应关系如下表所示:☀♬☾ Character.isDigit(char ch)源码解析
在Java.lang包中Character类中找到isDigit(char ch)方法。isDigit(char ch)方法根据ascii码表将字符类型ch转换为int类型并传给Character类中的isDigit,通过查阅ascii码表知道 ‘0’-‘9’字符对应整数区间为48~57. /**
* General category "Nd" in the Unicode specification.
* @since 1.1
*/
public static final byte DECIMAL_DIGIT_NUMBER = 9;
public static boolean isDigit(char ch) {
return isDigit((int)ch);
}
public static boolean isDigit(int codePoint) {
return getType(codePoint) == Character.DECIMAL_DIGIT_NUMBER;
}
通过源码可以分析出,函数的实现过程为:首先将传入的字符转换为对应的ASCII码值,然后将ASCII码值传入getType方法,看是否返回的值为9,若为9,则标识传入的字符为数字字符,否则反之。那么。getType方法到底如何实现判断字符类型,为什么返回的值要与9进行对比呢?
☀♬☾ Character.getType(int codePoint)源码解析
public static int getType(int codePoint) {
return CharacterData.of(codePoint).getType(codePoint);//注:此getType方法为CharacterData.of返回实例的getType方法。
}
getType方法调用了同在java.lang包中CharacterData的静态方法of(int ch)。
static final CharacterData of(int ch) {
if (ch >>> 8 == 0) { // fast-path
return CharacterDataLatin1.instance;
}else{
……
}
of方法返回了CharacterData的子类CharacterDataLatin1的实例
static final CharacterDataLatin1 instance = new CharacterDataLatin1();
通过源码可以分析出,Character.getType(int codePoint)方法的实现结果为,返回一个CharacterDataLatin1的实例,然后调用CharacterDataLatin1的getType方法。返回CharacterDataLatin1实例instance时,会自动执行CharacterDataLatin1类中的静态代码块中的代码给int类型数组A赋值。
static final int A[] = new int[256];
static {
{ // THIS CODE WAS AUTOMATICALLY CREATED BY GenerateCharacter:
char[] data = A_DATA.toCharArray();
assert (data.length == (256 * 2));
int i = 0, j = 0;
while (i < (256 * 2)) {
int entry = data[i++] << 16;
A[j++] = entry | data[i++];
}
}
}
其中,A_DATA为类中定义的字符串(注:下面不是乱码为512个16进制表示的数)。静态代码将A_DATA字符串转换为字符数组,然后通过循环,将相邻两个4个字节表示的数字拼接为8个字节表示的数并存储在数组A中。
static final String A_DATA =
“\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800”+
“\u100F\u4800\u100F\u4800\u100F\u5800\u400F\u5000\u400F\u5800\u400F\u6000\u400F”+
“\u5000\u400F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800”+
“\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F”+
“\u4800\u100F\u4800\u100F\u5000\u400F\u5000\u400F\u5000\u400F\u5800\u400F\u6000”+
“\u400C\u6800\030\u6800\030\u2800\030\u2800\u601A\u2800\030\u6800\030\u6800”+
“\030\uE800\025\uE800\026\u6800\030\u2000\031\u3800\030\u2000\024\u3800\030”+
“\u3800\030\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800”+
“\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u3800\030\u6800\030”+
“\uE800\031\u6800\031\uE800\031\u6800\030\u6800\030\202\u7FE1\202\u7FE1\202”+
“\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1”+
“\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202”+
“\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1\202\u7FE1”+
“\202\u7FE1\uE800\025\u6800\030\uE800\026\u6800\033\u6800\u5017\u6800\033\201”+
“\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2”+
“\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201”+
“\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2\201\u7FE2”+
“\201\u7FE2\201\u7FE2\201\u7FE2\uE800\025\u6800\031\uE800\026\u6800\031\u4800”+
“\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u5000\u100F”+
“\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800”+
“\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F”+
“\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800”+
“\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F\u4800\u100F”+
“\u3800\014\u6800\030\u2800\u601A\u2800\u601A\u2800\u601A\u2800\u601A\u6800”+
“\034\u6800\030\u6800\033\u6800\034\000\u7005\uE800\035\u6800\031\u4800\u1010”+
“\u6800\034\u6800\033\u2800\034\u2800\031\u1800\u060B\u1800\u060B\u6800\033”+
“\u07FD\u7002\u6800\030\u6800\030\u6800\033\u1800\u050B\000\u7005\uE800\036”+
“\u6800\u080B\u6800\u080B\u6800\u080B\u6800\030\202\u7001\202\u7001\202\u7001”+
“\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202”+
“\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001”+
“\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\u6800\031\202\u7001\202”+
“\u7001\202\u7001\202\u7001\202\u7001\202\u7001\202\u7001\u07FD\u7002\201\u7002”+
“\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201”+
“\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002”+
“\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\u6800”+
“\031\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002\201\u7002”+
“\u061D\u7002”;
☀♬☾ CharacterDataLatin1.getType(int codePoint)源码解析
int getType(int ch) {
int props = getProperties(ch);
return (props & 0x1F);
}
int getProperties(int ch) {
char offset = (char)ch;
int props = A[offset];
return props;
}
根据ACCII编码规则,‘0’-‘9’数字字符对应整数为48-57,将其作为数组偏移量,对应A_DATA字符串的
\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800”+
“\u3609\u1800\u3609\u1800\u3609\u1800\u3609\u1800\u3609
其对应A数组中的值为
A[48]:18003609
A[49]:18003609
………………
因此,若ch为数字字符,则getProperties(ch)会返回props = 0x18003609,则
props & ox1F = 9