问题背景
在做一个算法定点化移位过程中,遇到个奇怪问题:分别按无符号数和有符号数进行右移,竟然不管啥输入,res1和res2结果都一样。代码如下:
int64_t tmp = -16;
int32_t res1 = (int32_t)(((uint64_t)tmp) >> 1);
int32_t res2 = (int32_t)(tmp >> 1);
if (res1 != res2) {
printf("res1=%d, res2=%d\n", res1, res2);
}
照之前博客分析,C学习:无符号有符号数的移位问题分析总结,这不符合科学啊,相当于之前的博客是一顿瞎分析的。
验证分析
接下来,我分别对tmp单独移位验证了下,看无符号和有符号数移位是否有区别。代码如下:
int16_t a = -16;
printf("0x%hx\n", a);
a >>= 1;
printf("0x%hx\n", a);
printf("%d\n", a);
a = -16;
uint16_t b = (uint16_t)a;
printf("0x%hx\n", b);
b >>= 1;
printf("0x%hx\n", b);
printf("%hu\n", b);
从辅助验证的结果可知,按有符号数移位时,符号位是带着在变的,说明之前的博客分析没错。
这,问题来了。。。
理论上第一段代码中第二行加了强制无符号64位转换后**(uint64_t)**,应该移位结果跟第三行结果不一样啊,为啥res1和res2又是相等的?
于是,我把第一段代码进一步拆解后,发现了答案。
int64_t tmp = -16;
int64_t a;
uint64_t b;
a = tmp >> 1;
b = ((uint64_t)tmp) >> 1;
printf("0x%llx\n", a);
printf("0x%llx\n", b);
int32_t res1 = (int32_t)b; // 31 shift
int32_t res2 = (int32_t)a;
printf("res1=%d, res2=%d\n", res1, res2);
tmp移位结果确实是不一样的,但是问题关键在于截断,由64位向32位截断时,取的是低32位字节,于是结果一致。所以这里更重要的知识点要看下博客C学习:不同位宽整数扩展问题分析。
简而言之,有符号数移位后确实结果有差异,但截断后掩盖了这种差异,关键在于高位宽数据向低位宽数据转换的原理。需要注意的是,如果移位的位数过多,可能导致截断后依然有差异,比如上述代码中如tmp赋值-2147483648,右移33位,结果就有巨大差异。
另一个值得注意的问题,实践中常用右移左移来替代2的幂次方乘除,但是在有符号数场景,由于负数补码的关系,常与预期相反。比如,比如-2向右移两位,若按算术移位处理,结果不等于除以4的商,即0,而是-1。进而,向右移大于等于两位时,结果都一直为-1。所以,在移位后商为0的场景,务必要注意是否符合预期。