计算机中的进制 & 位运算
为什么计算机用二进制计数:
计算机是由电路构成的, 电路只有 0 和 1 两种状态.
不同进制间的换算:
在十进制中, 个位的 1 代表 10=1, 十位的 1 代表 10¹=10, 百位的 1 代表 10²=100, 所以: 123=1*10²+2*10¹+3*10
同样道理, 在二进制中, 个位的 1 代表 2=1, 十位的 1 代表 2¹=2, 百位的 1 代表 2²=4, 所以:(A3A2A1A0)=A3*2³+A2*2²+A1*2¹+A0*2
如果二进制和十进制数出现在同一个等式中, 为了区别我们用(A3A2A1A0)这种形式表示 A3A2A1A0 是二进制数, 每个数字只能是 0 或 1, 其它没有套括号加下标的数仍表示十进制数. 对于(A3A2A1A0)这样一个二进制数, 最左边的 A3 位称为最高位(MSB,Most Significant Bit), 最右边的 A0 位称为最低位(LSB,Least Significant Bit). 以后我们遵循这样的惯例: LSB 称为第 0 位而不是第 1 位, 所以如果一个数是 32 位的, 则 MSB 是第 31 位. 上式就是从二进制到十进制的换算公式.
下面来看十进制怎么换算成二进制. 我们知道
13=1*2³+1*2²+0*2¹+1*2 所以 13 换算成二进制应该是(1101). 问题是怎么把 13 分解成等号右边的形式呢? 注意到等号右边可以写成
13=(((0*2+1)*2+1)*2+0)*2+1
我们将 13 反复除以 2 取余数就可以提取出上式中的 1101 四个数字, 为了让读者更容易看清楚是哪个 1 和哪个 0, 上式和下式中对应的数字都加了下标:
13÷2=6...1 6÷2=3...0 3÷2=1...1 1÷2=0...1
把这四步得到的余数按相反的顺序排列就是 13 的二进制表示, 因此这种方法称为除二反序取余法.
计算机用二进制表示数, 程序员也必须习惯使用二进制, 但二进制写起来太啰嗦了, 所以通常将二进制数分成每三位一组或者每四位一组, 每组用一个数字表示. 比如把(10110010)从最低位开始每三位分成一组, 10,110,010, 然后把每组写成一个十进制数字, 就是(262), 这样每一位数字的取值范围是 0~7, 逢八进一, 称为八进制(Octal). 类似地, 把(10110010)分成每四位一组, 1011,0010, 然后把每组写成一个数字, 这个数的低位是 2, 高位已经大于 9 了, 我们规定用字母 A~F 表示 10~15, 这个数可以写成(B2), 每一位数字的取值范围是 0~F, 逢十六进一, 称为十六进制(Hexadecimal). 所以, 八进制和十六进制是程序员为了书写二进制方便而发明的简便写法, 好比草书和正楷的关系一样.
位运算:
整数在计算机中用二进制的位来表示, C 语言提供一些运算符可以直接操作整数中的位, 称为位运算.
1.1. 按位与, 或, 异或, 取反运算
按位与(&): 两个操作数都是 1, 结果是 1, 否则是 0
或(|): 两个操作数有一个 1, 结果是 1
异或(^): 两个操作数相同则结果为 0, 两个操作数不同则结果为 1
取反运算(~): 对操作数取反
1.2. 移位运算
移位运算符 (Bitwise Shift) 包括左移<>. 左移将一个整数的各二进制位全部左移若干位, 例如 0xcfffffff3<<2 得到 0x3fffffcc:
Java 平台都是有符号整数, 所以上述图一操作在 Java 中符号位发生了变化值由 (-805306381) 变为(1073741772)
在一定的取值范围内, 将一个整数左移 1 位相当于乘以 2. 比如二进制 11(十进制 3)左移一位变成 110, 就是 6, 再左移一位变成 1100, 就是 12. 读者可以自己验证这条规律对有符号数和无符号数都成立, 对负数也成立. 当然, 如果左移改变了最高位(符号位), 那么结果肯定不是乘以 2 了, 所以我加了个前提 "在一定的取值范围内". 由于计算机做移位比做乘法快得多, 编译器可以利用这一点做优化, 比如看到源代码中有 i * 8, 可以编译成移位指令而不是乘法指令.
当操作数是无符号数时, 右移运算的规则和左移类似, 例如 0xcffffff3>>2 得到 0x33fffffc:
Java 平台执行结果: 值由 - 805306381 变成 -201326596 仍然保留负数的符号位, 相当于除以 4
最低两位的 11 被移出去了, 最高两位又补了两个 0, 其它位依次右移两位. 和左移类似, 移动的位数也必须小于左操作数的总位数, 否则结果是 Undefined. 在一定的取值范围内, 将一个整数右移 1 位相当于除以 2, 小数部分截掉.
当操作数是有符号数时, 右移运算的规则比较复杂:
如果是正数, 那么高位移入 0
如果是负数, 那么高位移入 1 还是 0 不一定, 这是 Implementation-defined 的. 对于 x86 平台的 gcc 编译器, 最高位移入 1, 也就是仍保持负数的符号位, 这种处理方式对负数仍然保持了 "右移 1 位相当于除以 2" 的性质.
综上所述, 由于类型转换和移位等问题, 用有符号数做位运算是很不方便的, 所以, 建议只对无符号数做位运算, 以减少出错的可能.
1.3. 掩码:
如果要对一个整数中的某些位进行操作, 怎样表示这些位在整数中的位置呢? 可以用掩码 (Mask) 来表示. 比如掩码 0x0000ff00 表示对一个 32 位整数的 8~15 位进行操作, 举例如下.
1, 取出 8~15 位.unsignedinta,b,mask=0x0000ff00;
a=0x12345678;
b=(a&mask)>>8;/* 0x00000056 */
2, 将 8~15 位清 0.unsignedinta,b,mask=0x0000ff00;
a=0x12345678;
b=a&~mask;/* 0x12340078 */
3, 将 8~15 位置 1.unsignedinta,b,mask=0x0000ff00;
a=0x12345678;
b=a|mask;/* 0x1234ff78 */
位运算在雪花算法的应用:
12bits 毫秒增量的最大值: 1 右移 12 位减去 1, 可以自己用等比数列计算下 12bit 的最大值, 看是否和位移的结果一致; 二进制表示:(...001111 1111 1111)(14 位以后的 0 用省略号代替)
10bits 工作进程 Id :1 右移 10 位, 这里我有个疑问, 不应该再减去 1, 才是最大值么
判断是否需要获取下一个时间的依据: 0L == (sequence = ++sequence & SEQUENCE_MASK) sequence 和最大值两个数 按位与, 只有当 sequence 大于 SEQUENCE_MASK 的时候,& 的结果是 0, 获取下一个时间戳
41bits:(currentMillis - EPOCH) <
((currentMillis - EPOCH) << TIMESTAMP_LEFT_SHIFT_BITS) | (workerId << WORKER_ID_LEFT_SHIFT_BITS) | sequence; 41bits|10bits|12bits, 因为右移低位补 0, 按位或操作, 其实就是操作数本身.
shrding-jdbc 默认的实现:/**
* 默认的主键生成器.
*
*
* 长度为 64bit, 从高位到低位依次为
*
*
*
* 1bit 符号位
* 41bits 时间偏移量从 2016 年 11 月 1 日零点到现在的毫秒数
* 10bits 工作进程 Id
* 12bits 同一个毫秒内的自增量
*
*
*
* 工作进程 Id 获取优先级: 系统变量{@code sharding-jdbc.default.key.generator.worker.id} 大于 环境变量{@code SHARDING_JDBC_DEFAULT_KEY_GENERATOR_WORKER_ID}
* , 另外可以调用 @{@code DefaultKeyGenerator.setWorkerId}进行设置
*
*
* @author gaohongtao
*/
@Getter
@Slf4j
publicfinalclassDefaultKeyGeneratorimplementsKeyGenerator{
publicstaticfinallongEPOCH;
publicstaticfinalStringWORKER_ID_PROPERTY_KEY="sharding-jdbc.default.key.generator.worker.id";
publicstaticfinalStringWORKER_ID_ENV_KEY="SHARDING_JDBC_DEFAULT_KEY_GENERATOR_WORKER_ID";
privatestaticfinallongSEQUENCE_BITS=12L;
privatestaticfinallongWORKER_ID_BITS=10L;
privatestaticfinallongSEQUENCE_MASK=(1<
privatestaticfinallongWORKER_ID_LEFT_SHIFT_BITS=SEQUENCE_BITS;
privatestaticfinallongTIMESTAMP_LEFT_SHIFT_BITS=WORKER_ID_LEFT_SHIFT_BITS+WORKER_ID_BITS;
privatestaticfinallongWORKER_ID_MAX_VALUE=1L<
@Setter
privatestaticTimeServicetimeService=newTimeService();
@Getter
privatestaticlongworkerId;
static{
Calendarcalendar=Calendar.getInstance();
calendar.set(2016,Calendar.NOVEMBER,1);
calendar.set(Calendar.HOUR_OF_DAY,0);
calendar.set(Calendar.MINUTE,0);
calendar.set(Calendar.SECOND,0);
calendar.set(Calendar.MILLISECOND,0);
EPOCH=calendar.getTimeInMillis();
initWorkerId();
}
privatelongsequence;
privatelonglastTime;
publicstaticvoidinitWorkerId(){
StringworkerId=System.getProperty(WORKER_ID_PROPERTY_KEY);
if(!Strings.isNullOrEmpty(workerId)){
setWorkerId(Long.valueOf(workerId));
return;
}
workerId=System.getenv(WORKER_ID_ENV_KEY);
if(Strings.isNullOrEmpty(workerId)){
return;
}
setWorkerId(Long.valueOf(workerId));
}
/**
* 设置工作进程 Id.
*
* @param workerId 工作进程 Id
*/
publicstaticvoidsetWorkerId(finallongworkerId){
Preconditions.checkArgument(workerId>=0L&&workerId
DefaultKeyGenerator.workerId=workerId;
}
/**
* 生成 Id.
*
* @return 返回 @{@link Long}类型的 Id
*/
@Override
publicsynchronizedNumbergenerateKey(){
longcurrentMillis=timeService.getCurrentMillis();
Preconditions.checkState(lastTime<=currentMillis,"Clock is moving backwards, last time is %d milliseconds, current time is %d milliseconds",lastTime,currentMillis);
if(lastTime==currentMillis){
if(0L==(sequence=++sequence&SEQUENCE_MASK)){
currentMillis=waitUntilNextTime(currentMillis);
}
}else{
sequence=0;
}
lastTime=currentMillis;
if(log.isDebugEnabled()){
log.debug("{}-{}-{}",newSimpleDateFormat("yyyy-MM-dd HH:mm:ss.SSS").format(newDate(lastTime)),workerId,sequence);
}
return((currentMillis-EPOCH)<
}
privatelongwaitUntilNextTime(finallonglastTime){
longtime=timeService.getCurrentMillis();
while(time<=lastTime){
time=timeService.getCurrentMillis();
}
returntime;
}
}
最后:
小尾巴走一波, 欢迎关注我的公众号, 不定期分享编程, 投资, 生活方面的感悟:)
来源: https://juejin.im/post/5c0296aae51d454556295dc5