最近工作碰到这么个小问题,分享一下:
java中我们常见的用来分片的方法就是取模,一般的方法就是
Math.abs(Long.valueOf(value).hashCode()) % shardingBase
在我们用一个脚本语言(例如这次的Python)去维护程序的时候,有时候我们需要一个同样的方法
现在问题来了,这么简单的一个方法怎么用Python来表示?
难道是:
long(value) % shardingbase
最后运行发现,基本不太一样。
我们看java在Long的hashcode()方法实现代码可以模仿出这个逻辑
在java8源码中,Long.valueof()源码核心代码如下:
final int offset = 128;
if (l >= -128 && l <= 127) { // will cache
return LongCache.cache[(int)l + offset];
}
return new Long(l);
//做了一个缓存,在此没大意义
private static class LongCache {
private LongCache(){}
static final Long cache[] = new Long[-(-128) + 127 + 1];
static {
for(int i = 0; i < cache.length; i++)
cache[i] = new Long(i - 128);
}
}
我们发现这个方法用Python来写基本没什么难度。没什么区别,主要区别看来就是在Java的hashCode()方法实现了,这个方法源码如下:
public int hashCode() {
return Long.hashCode(value);
}
public static int hashCode(long value) {
return (int)(value ^ (value >>> 32));
}
看来我们的主要任务就是把值右移动32位然后和本身做异或操作。因为我的问题是id不可能为负数,所以有符号右移和无符号右移再这对我没什么区别,这个问题好像也不大。这个地方的主要问题就是这个强转。Python中不存在int溢出的情况,因为他会自动将他转成一个long类型存放,所以,数子大一些的话用Python写出来的肯定不会是负数,结果肯定跟java不一样。所以这个时候Python应该这样写:
def longToInt(value):
assert isinstance(value, (int, long))
return int(value & sys.maxint)
def int_overflow(val):
maxint = 2147483647
if not -maxint-1 <= val <= maxint:
val = (val + (maxint + 1)) % (2 * (maxint + 1)) - maxint - 1
return val
//Python写法
abs(int_overflow(longToInt(id ^ (id >> 32)))) % 200
//java写法
Math.abs(Long.valueOf(id).hashCode()) % 200