在写代码的时候经常会碰到各种数据类型转换的问题,实现同样的数据类型转换功能,细心的同学会发现,jdk提供多种不同转方式。这次项目中碰到了字符串类型转换为Long类型的问题,比较一下valueOf跟parseLong这两种不同的转换方法。
两种实现方式的源代码比较
Long.parseLong的源代码
public static long parseLong(String s) throws NumberFormatException {
return parseLong(s, 10);
}
Long.valueOf的源代码
public static Long valueOf(String s) throws NumberFormatException
{
return Long.valueOf(parseLong(s, 10));
}
从它们各自实现的代码中,我们可以看出,它们都调用了一个parseLong的方法。不同的地方是,Long.valueOf对parseLong的返回结果调用了Long.valueOf方法进一步处理了一下。
我们先看一下它们共同方法parseLong的实现原理。
共同之处
public static long parseLong(String s, int radix)
throws NumberFormatException
{
if (s == null) {
throw new NumberFormatException("null");
}
if (radix < Character.MIN_RADIX) {
throw new NumberFormatException("radix " + radix +
" less than Character.MIN_RADIX");
}
if (radix > Character.MAX_RADIX) {
throw new NumberFormatException("radix " + radix +
" greater than Character.MAX_RADIX");
}
long result = 0;
boolean negative = false;
int i = 0, len = s.length();
long limit = -Long.MAX_VALUE;
long multmin;
int digit;
if (len > 0) {
char firstChar = s.charAt(0);
if (firstChar < '0') { // Possible leading "+" or "-"
if (firstChar == '-') {
negative = true;
limit = Long.MIN_VALUE;
} else if (firstChar != '+')
throw NumberFormatException.forInputString(s);
if (len == 1) // Cannot have lone "+" or "-"
throw NumberFormatException.forInputString(s);
i++;
}
multmin = limit / radix;
while (i < len) {
// Accumulating negatively avoids surprises near MAX_VALUE
digit = Character.digit(s.charAt(i++),radix);
if (digit < 0) {
throw NumberFormatException.forInputString(s);
}
if (result < multmin) {
throw NumberFormatException.forInputString(s);
}
result *= radix;
if (result < limit + digit) {
throw NumberFormatException.forInputString(s);
}
result -= digit;
}
} else {
throw NumberFormatException.forInputString(s);
}
return negative ? result : -result;
}
从上面的代码中可以看出,它们数据格式转换的步骤是这样子的:
- 对字符串判空
- 对基数进行校验,看基数是否在合法范围之内(2到36之间,包含边界)。从注释中可以看出,常用的基数有2、8、10、16、36这几种
- 判断正负性,然后将每一位乘以基值(基数^第几位),一步步得到long类型的数值。
这里有一点比较有意思。它是如何将一个character转换成一个数值类型的。无聊继续扒一扒。
public static int digit(int codePoint, int radix) {
return CharacterData.of(codePoint).digit(codePoint, radix);
}
我们先看一下CharacterData.of是做什么用。
static final CharacterData of(int ch) {
if (ch >>> 8 == 0) { // fast-path
return CharacterDataLatin1.instance;
} else {
switch(ch >>> 16) { //plane 00-16
case(0):
return CharacterData00.instance;
case(1):
return CharacterData01.instance;
case(2):
return CharacterData02.instance;
case(14):
return CharacterData0E.instance;
case(15): // Private Use
case(16): // Private Use
return CharacterDataPrivateUse.instance;
default:
return CharacterDataUndefined.instance;
}
}
}
}
这段代码它是判断一个字符的类型,这里共有7种类型(有兴趣的童鞋可以去研究一一下这7种类型的字符),接下来根据字符的类型来选择将字符转化为数字的方法。下面这一段是latin类型的字符转化为数字类型实现方法。
int digit(int ch, int radix) {
int value = -1;
if (radix >= Character.MIN_RADIX && radix <= Character.MAX_RADIX) {
int val = getProperties(ch);
int kind = val & 0x1F;
if (kind == Character.DECIMAL_DIGIT_NUMBER) {
value = ch + ((val & 0x3E0) >> 5) & 0x1F;
}
else if ((val & 0xC00) == 0x00000C00) {
// Java supradecimal digit
value = (ch + ((val & 0x3E0) >> 5) & 0x1F) + 10;
}
}
return (value < radix) ? value : -1;
}
不同之处
1、返回的对象不同 Long.valueOf()返回的是一个原始类型,Long.valueOf()返回的是一个Long装箱对象。这里如果只需要基础数据类型,用这种方法相对性能更好。 2、处理步骤有差异 Long.valueOf在返回基础类型时候,并将基础类型封装成了对象。这里有个点比较有意思。
public static Long valueOf(long l) {
final int offset = 128;
if (l >= -128 && l <= 127) { // will cache
return LongCache.cache[(int)l + offset];
}
return new Long(l);
}
这里,对-128到127之间的long类型的数据封装成静态对象数组,下次取的时候直接从数组中取,不用再次构建。这对于-128到127之间的字符串转化为Long对象,性能有一点提升。
总结:
在字符串转换为long类型的数据时,如果只需要转换为基础类型,用Long.parseLong性能较好;如果需要获得Long对象,并且数值在-128到127之间,Long.valueOf性能比较好