java java.lang.Long详解之一:toString()

16 篇文章 0 订阅

陆陆续续花了近两周时间看完了Long.java,可以说收获颇丰。也花了几天时间构思应该如何去写出来,苦于一直没有好的思路,又不能在这里干耗着浪费时间。所以就准备写出来了。很随意的写,想到哪里写到哪里。准备贴很多源码,附加我个人的理解。

toString(long i, int radix)

首先让我们目睹下Long中强大的toString方法。

 

[java]  view plain copy print ?
  1. public static String toString(long i, int radix) {  
  2.   if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)  
  3.       radix = 10;  
  4.   if (radix == 10)  
  5.       return toString(i);  
  6.   char[] buf = new char[65];  
  7.   int charPos = 64;  
  8.   boolean negative = (i < 0);  
  9.   if (!negative) {  
  10.     i = -i;  
  11.   }  
  12.   while (i <= -radix) {  
  13.     buf[charPos--] = Integer.digits[(int)(-(i % radix))];  
  14.     i = i / radix;  
  15.   }  
  16.   buf[charPos] = Integer.digits[(int)(-i)];  
  17.   if (negative) {   
  18.     buf[--charPos] = '-';  
  19.   }  
  20.   return new String(buf, charPos, (65 - charPos));  
  21. }  

第二个参数radix是进制数,范围是:2-36.大家都知道1进制没什么意义,所以进制数从2开始,我一直对36存在疑问,虽然它是0-9和a-z一共36个字符组成,所以最大进制数定义为36.但是还有大写字母啊,还有26个呢,这样就可以定义最大62进制。也许有什么渊源在这里我不知道,我在OSChina上也发过问,但是都没有让我很满意的答案。

radix如果不在2-36范围内,则默认10进制。而如果是10进制,Long有专门将10进制的Long转化为String的toString方法,稍后再说。

非10进制的toString就在这里负责处理。

[java]  view plain copy print ?
  1. char[] buf = new char[65];  

刚开始我很不理解为什么要声明长度为65的char数组呢,long64位就够了啊。仔细琢磨了一下发现,多声明一个是为负数做准备,如果是正数那么确实是只用了64位(这里不算严谨,不过先把65这个问题说清楚)。请看下面一段代码:

[java]  view plain copy print ?
  1. if (negative) {   
  2.   buf[--charPos] = '-';  
  3.  }  
  4. return new String(buf, charPos, (65 - charPos));  

清楚了吧,这个buf0如果有值,那么只可能是”-“,不会是其他任何值。最后一行也很好理解,用了几位,那么就传给String构造函数几位。所以上面说的”正数只用64位”是不严谨的。

我喜欢这里negative的用法,算不上很巧妙,但是避开了正数和负数的差异。

[java]  view plain copy print ?
  1. if (!negative) {  
  2.   i = -i;  
  3. }  

一开始我同样不理解为啥要把一个正数转换为负数再处理呢?看下面这个代码片段:

[java]  view plain copy print ?
  1. while (i <= -radix) {  
  2.   buf[charPos--] = Integer.digits[(int)(-(i % radix))];  
  3.   i = i / radix;  
  4. }  
  5. buf[charPos] = Integer.digits[(int)(-i)];  

请看while内部与外部,设想如果i是正是负未知,那么这两处就没法统一使用-(i % radix)和-i了。所以将i提前转换为负值了。 Integer.digits是个挺巧妙的东西,可以随意应付2-36进制的转换。它是这样定义的: Liquid error: Flag value is invalid: -O ”” 比如说,radix = 2,那么i % radix只能为0或者1,对应digits0或者digits1,依此类推。

我想这个toString已经介绍的够详细了。另外,源码中将i转换为负数,那么转换为正数也肯定成立吧。于是我做了一点点改动:

[java]  view plain copy print ?
  1. final static char[] digits = {  
  2.   '0' , '1' , '2' , '3' , '4' , '5' ,  
  3.   '6' , '7' , '8' , '9' , 'a' , 'b' ,  
  4.   'c' , 'd' , 'e' , 'f' , 'g' , 'h' ,  
  5.   'i' , 'j' , 'k' , 'l' , 'm' , 'n' ,  
  6.   'o' , 'p' , 'q' , 'r' , 's' , 't' ,  
  7.   'u' , 'v' , 'w' , 'x' , 'y' , 'z'  
  8. };  
  9. public static String toString(long i, int radix) {  
  10.   if (radix < Character.MIN_RADIX || radix > Character.MAX_RADIX)  
  11.     radix = 10;  
  12.   if (radix == 10)  
  13.     return "";//不是重点,直接跳过  
  14.   char[] buf = new char[65];  
  15.   int charPos = 64;  
  16.   boolean negative = (i < 0);  
  17.   if (negative) {  
  18.     i = -i;  
  19.   }  
  20.   while (i >= radix) {  
  21.     buf[charPos--] = digits[(int)((i % radix))];  
  22.     i = i / radix;  
  23.   }  
  24.   buf[charPos] = digits[(int)(i)];  
  25.   if (negative) {   
  26.     buf[--charPos] = '-';  
  27.   }  
  28.   return new String(buf, charPos, (65 - charPos));  
  29. }  

依旧奏效哦!

[java]  view plain copy print ?
  1. System.out.println(Long.toString(-8L, 2));  
  2. System.out.println(toString(-8L,2));  


[java]  view plain copy print ?
  1. 输出结果:  
  2. -1000  
  3. -1000  

toString(long i)

这个toString方法用于将参数i转化为十进制形式的字符串,toString(long i)本身是很简单的,核心是getChars(long i, int index, char buf)。那么就一起目睹下它们都是如何实现的。

[java]  view plain copy print ?
  1. public static String toString(long i) {  
  2.   if (i == Long.MIN_VALUE)  
  3.     eturn "-9223372036854775808";  
  4.   int size = (i < 0) ? stringSize(-i) + 1 : stringSize(i);  
  5.   char[] buf = new char[size];  
  6.   getChars(i, size, buf);  
  7.   return new String(0, size, buf);  
  8. }  


[java]  view plain copy print ?
  1. static void getChars(long i, int index, char[] buf) {  
  2.   long q;  
  3.   int r;  
  4.   int charPos = index;  
  5.   char sign = 0;  
  6.   if (i < 0) {  
  7.     sign = '-';  
  8.     i = -i;  
  9.   }  
  10.   // Get 2 digits/iteration using longs until quotient fits into an int  
  11.   //8-4字节  
  12.   while (i > Integer.MAX_VALUE) {   
  13.     q = i / 100;  
  14.     // really: r = i - (q * 100);  
  15.     r = (int)(i - ((q << 6) + (q << 5) + (q << 2)));  
  16.     i = q;  
  17.     buf[--charPos] = Integer.DigitOnes[r];  
  18.     buf[--charPos] = Integer.DigitTens[r];  
  19.   }  
  20.   // Get 2 digits/iteration using ints  
  21.   //4-2字节  
  22.   int q2;  
  23.   int i2 = (int)i;  
  24.   while (i2 >= 65536) {  
  25.     q2 = i2 / 100;  
  26.     // really: r = i2 - (q * 100);  
  27.     r = i2 - ((q2 << 6) + (q2 << 5) + (q2 << 2));  
  28.     i2 = q2;  
  29.     buf[--charPos] = Integer.DigitOnes[r];  
  30.     buf[--charPos] = Integer.DigitTens[r];  
  31.   }  
  32.   // Fall thru to fast mode for smaller numbers  
  33.   // assert(i2 <= 65536, i2);  
  34.   //2-0字节  
  35.   for (;;) {  
  36.     q2 = (i2 * 52429) >>> (16+3);  
  37.     r = i2 - ((q2 << 3) + (q2 << 1));  // r = i2-(q2*10) ...  
  38.     buf[--charPos] = Integer.digits[r];  
  39.     i2 = q2;  
  40.     if (i2 == 0break;  
  41.   }  
  42.   if (sign != 0) {  
  43.     buf[--charPos] = sign;  
  44.   }  
  45. }  


这个getChars可是各种巧妙,首先来看看下面这张图:


 从图中可以看出,一个long类型的数字被分成了3段:8-4字节,4-2字节,2-0字节。三段分别处理。下面就一段一段剖析其中的巧妙之处。

8-4字节处理

这段的主要目的是经过它的处理之后,能将一个long类型的数字转换成int来处理。这段while中几乎每行都是经典,首先这行:r = (int)(i - ((q << 6) + (q << 5) + (q << 2)));很巧妙的使用高效的位移运算完成了r = i - (q * 100)。其实这样做事为了得到i的最后两位,比如2147483649这样一个long,经过这步之后r = 49.

随后更巧妙的一件事就又发生了。那就是Integer中的DigitOnes和DigitTens巧妙的设计。那就看看这两个数组是如何巧妙的。

[java]  view plain copy print ?
  1. final static char [] DigitTens = {  
  2.   '0''0''0''0''0''0''0''0''0''0',  
  3.   '1''1''1''1''1''1''1''1''1''1',  
  4.   '2''2''2''2''2''2''2''2''2''2',  
  5.   '3''3''3''3''3''3''3''3''3''3',  
  6.   '4''4''4''4''4''4''4''4''4''4',  
  7.   '5''5''5''5''5''5''5''5''5''5',  
  8.   '6''6''6''6''6''6''6''6''6''6',  
  9.   '7''7''7''7''7''7''7''7''7''7',  
  10.   '8''8''8''8''8''8''8''8''8''8',  
  11.   '9''9''9''9''9''9''9''9''9''9',  
  12.   } ;   
  13. final static char [] DigitOnes = {   
  14.   '0''1''2''3''4''5''6''7''8''9',  
  15.   '0''1''2''3''4''5''6''7''8''9',  
  16.   '0''1''2''3''4''5''6''7''8''9',  
  17.   '0''1''2''3''4''5''6''7''8''9',  
  18.   '0''1''2''3''4''5''6''7''8''9',  
  19.   '0''1''2''3''4''5''6''7''8''9',  
  20.   '0''1''2''3''4''5''6''7''8''9',  
  21.   '0''1''2''3''4''5''6''7''8''9',  
  22.   '0''1''2''3''4''5''6''7''8''9',  
  23.   '0''1''2''3''4''5''6''7''8''9',  
  24.   } ;  

通过这两个精巧的数组,巧妙的将两位数字转化为十位和个位,比如49用这两个数组表示就是DigitTens49=4和DigitOnes49=9。我真心喜欢这个设计。这样也就非常简单的就将一个两位数一位一位放入char数组中了。 再次强调q * 100的实现方式,100 = 64 + 32 + 4,通过位移q再相加,完美实现q * 100。 直到这个long可以被int表示时,转入下一段。

4-2字节处理

这段代码的处理方式几乎同上一段是一模一样的,区别在于这里处理的是int而不是long。

2-0字节处理

我一直都特别奇怪为什么要在2个字节这个点分割呢!我们稍后在小结里面描述,除了这点,还有一处亮点:q2 = (i2 * 52429) >>> (16+3); 这个可是让我困惑了好久好久的。后来无意中在javaeye上搜到一篇帖子上揭露了这个美丽的亮点,52429/524288 = 0.10000038146972656, 524288 = 1 << 19,换句话说q2 = (i2 * 52429) >>> (16+3);就是q2 = i2/10为了避免效率低下的除法,换用了这种方式实现除法,真是绝啊!

小结

总结一下getChars这个绝妙的方法,之所以分成3段,是因为JVM的实现中,int的效率最高,long的效率很低,所以第一步就将long转换成int,再进行处理。然后呢,为了避免除法,而且乘以52429之后可以被int表示,不会溢出,所以就出现了2字节这个分割点。总之呢,toString(long i)方法绝对是个绝妙的方法啊。里面有许多值得借鉴的地方。

toUnsignedString(long i, int shift)

接下来让我们认识下toUnsignedString(long i, int shift),这个方法同样巧妙,一个方法就把long转二进制,八进制,十六进制全部搞定。仅仅通过shift一个参数,同样是通过位移来实现的。比如八进制,那么shift就是3,然后通过1 >> 3实现。唯一一个限制就是只能表示进制数是2的n次幂。

[java]  view plain copy print ?
  1. private static String toUnsignedString(long i, int shift) {  
  2.   char[] buf = new char[64];  
  3.   int charPos = 64;  
  4.   int radix = 1 << shift;  
  5.   long mask = radix - 1;  
  6.   do {  
  7.     buf[--charPos] = Integer.digits[(int)(i & mask)];  
  8.     i >>>= shift;  
  9.   } while (i != 0);  
  10.   return new String(buf, charPos, (64 - charPos));  
  11. }  

首先通过int radix = 1 << shift;实现进制数的转换,

随后就是一个精心的设计,long mask = radix -1; 为什么要有这样一个值呢?其实是这样的,radix是2的n次幂,减1之后就是全1了,比如8-1的二进制就是111,其他同理。然后i & mask就取到进制数对应二进制的位数。比如十六进制的mask = 15,对应的二进制为1111,i & mask就是取i对应二进制的后四位。再从Integer.digits中取得对应进制数的值。

最后,再通过i >>>= shift; 将已经取得的位数移除掉,直至i=0为止。

总结

这样Long中的toString方法簇就解析完毕。总之一句话,Long就像一座宝库,每走一步都是金子。期待下一桶金子吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值