符号位扩展问题总结

符号位扩展问题总结

由如下的一段代码作为本篇文章的引子,也可以通过它看出在写代码时,注意数值转换的重要性。这段代码是将各种类型的数值与unsigned int -1值对比,请注意对比后的结果。

#include <stdio.h>
 
#define comp_printf(FIRST, SECOND) printf("LINE%02d:  "#FIRST" %s "#SECOND"\n", __LINE__, FIRST == SECOND?"==":"!=")
 
int main()
{
    const unsigned int ui_pos = static_cast<unsigned int>(-1);
 
    char ci_pos_1 = ui_pos;
10     comp_printf(ui_pos, ci_pos_1);
11     char ci_pos_2 = static_cast<char>(-1);
12     comp_printf(ui_pos, ci_pos_2);
13  
14     unsigned char uc_pos_1 = ui_pos;
15     comp_printf(ui_pos, uc_pos_1);
16     unsigned char uc_pos_2 = static_cast<unsigned char>(-1);
17     comp_printf(ui_pos, uc_pos_2);
18  
19     short si_pos_1 = ui_pos;
20     comp_printf(ui_pos, si_pos_1);
21     short si_pos_2 = static_cast<short>(-1);
22     comp_printf(ui_pos, si_pos_2);
23  
24     unsigned short us_pos_1 = ui_pos;
25     comp_printf(ui_pos, us_pos_1);
26     unsigned short us_pos_2 = static_cast<unsigned short>(-1);
27     comp_printf(ui_pos, us_pos_2);
28    
29     unsigned long ul_pos_1 = ui_pos;
30     comp_printf(ui_pos, ul_pos_1);
31     unsigned long ul_pos_2 = static_cast<unsigned long>(-1);
32     comp_printf(ui_pos, ul_pos_2);
33  
34     long long ll_pos_1 = ui_pos;
35     comp_printf(ui_pos, ll_pos_1);
36     long long ll_pos_2 = static_cast<long long>(-1);
37     comp_printf(ui_pos, ll_pos_2);
38        
39     unsigned long long ull_pos_1 = ui_pos;
40     comp_printf(ui_pos, ull_pos_1);
41     unsigned long long ull_pos_2 = static_cast<unsigned long long>(-1);
42     comp_printf(ui_pos, ull_pos_2);
43  
44     return 0;
45 }
46  

上述代码在GCC3.3.4环境编译执行结果如下:

LINE10: ui_pos == ci_pos_1
LINE12: ui_pos == ci_pos_2
LINE15: ui_pos != uc_pos_1
LINE17: ui_pos != uc_pos_2
LINE20: ui_pos == si_pos_1
LINE22: ui_pos == si_pos_2
LINE25: ui_pos != us_pos_1
LINE27: ui_pos != us_pos_2
LINE30: ui_pos == ul_pos_1
LINE32: ui_pos == ul_pos_2
LINE35: ui_pos == ll_pos_1
LINE37: ui_pos != ll_pos_2
LINE40: ui_pos == ull_pos_1
LINE42: ui_pos != ull_pos_2

由上述的结果我们得出了一个结论,不同类型数字的对比,-1和-1并不都是相等的。究其原因就是对比数字需要将二者转换到同一种类型,而在转换过程中可能存在符号位扩展,由此导致值不尽相同的现象。

LINE25、27在对比前us_pos_1和us_pos_2的值都为0xFFFF,而ui_pos的值为0xFFFFFFFF。当unsigned short和unsigned int对比时,前者向后者的类型转换进行0扩展,也就是0x0000FFFF和0xFFFFFFFF对比,很显然二者是不相同的。

LINE20、22与LINE25、27的不同之处仅在于是它们无符号数,可结果为什么这么大的差别?在对比前si_pos_1和si_pos_2的值都为0xFFFF。当short和unsigned int对比时,前者向后者的类型转换进行1扩展,也就是0xFFFFFFFF和0xFFFFFFFF对比,所以对比的结果为真。

LINE35结果为真的原因是:在赋值时unsigned int 向 long long类型转换,进行0扩展,相当于ll_pos_1=0x00000000FFFFFFFF。在对比时unsigned int再次向long long类型转换,相当于0x00000000FFFFFFFF(us_pos转换后的结果)与0x00000000FFFFFFFF(就是ll_pos_1)对比,所以二者相同。

LINE37结果为假的原因是:在赋值时-1向long long类型转换,-1作为有符号数进行1扩展,相当于ll_pos_1=0xFFFFFFFFFFFFFFFF。在对比时unsigned int向long long类型转换,相当于0x00000000FFFFFFFF(us_pos转换后的结果)与0xFFFFFFFFFFFFFFFF(就是ll_pos_1)对比,显然二者不同。

实际错误例子

由于存在类型转换,对比时如果使用了不恰当的数字类型,极有可能会与自己预想的结果不一样。比如下面的这种情况。

std::string s_string("teststring");
unsigned short us_pos = s_string.find("google");
if (us_pos == std::string::npos)
    printf("'google' is not found  in 'teststring'\n");
else
    printf("'google' is found in 'teststring'\n");


我们先分析下各值的情况,一般情况下std::string::npos = (size_t)-1,而size_t一般为unsigned int类型。所以us_pos的初始值被赋为(unsigned int)-1,us_pos = 0xFFFF。在对比时us_pos向unsigned int类型转换,相当于0x0000FFFF(us_pos转换后的值)与0xFFFFFFFF(std::string::npos的值)对比。这时打印的信息是:'google’ is found in ‘teststring’。这个结果显然是不对的。正确的情况应该是:std::string::size_type pos = s_string.find(“google”);

转换规则总结

下面我们总结下不同类型数字间转换的规则,以后的编程时请注意数字转换带来的影响。

原类型 转换后类型转换规则
char-->unsigned char最高位变成数据位,不再表示符号位
char-->short符号位扩展
char-->unsigned short符号位扩展(先符号位扩展到short;然后由short转成unsigned short)
char-->long符号位扩展
char-->unsigned long符号位扩展(先符号位扩展到long;然后由long转成unsigned long)
char-->float先符号位扩展到long;然后由long转成float
char-->double先符号位扩展到long;然后由long转成double
char-->long double先符号位扩展到long;然后由long转成long double
short-->char保留低字节(short si = 0x1234; char ci = si; ci实际为0x34)
short-->unsigned char保留低字节
short-->unsigned short最高位变成数据位,不再表示符号位
short-->long符号位扩展
short-->unsigned long符号位扩展(先符号位扩展到long;然后由long转成unsigned long)
short-->long long符号位扩展
short-->unsigned long long符号位扩展(先符号位扩展到long long;然后再转成unsigned long long)
short-->float先符号位扩展到long;然后由long转成float
short-->double先符号位扩展到long;然后由long转成double
short-->long doubile先符号位扩展到long;然后由long转成long double
int-->long long符号位扩展
int-->unsigned long long符号位扩展(先符号位扩展到long long;然后再转成unsigned long long)
long-->char保留低字节
long-->unsigned char保留低字节
long-->short保留低字节
long-->unsigned short保留低字节
long-->unsigned long最高位变成数据位,不再表示符号位
long-->long long符号位扩展
long-->unsigned long long符号位扩展(先符号位扩展到long long;然后再转成unsigned long long)
long-->float使用单精度浮点数表示,可能丢失精度。
long-->double使用双精度浮点数表示,可能丢失精度。
long-->long double使用双精度浮点数表示,可能丢失精度。
    
unsigned char-->char最高位作为符号位
unsigned char-->short0扩展
unsigned char-->unsigned short0扩展
unsigned char-->int0扩展
unsigned char-->unsigned int0扩展
unsigned char-->long0扩展
unsigned char-->unsigned long0扩展
unsigned char-->float先转换到long然后再转换到float
unsigned char-->double先转换到long然后再转换到double
unsigned short-->char保留低字节
unsigned short-->unsigned char保留低字节
unsigned short-->short最高位作为符号位
unsigned short-->long0扩展
unsigned short-->unsigned long0扩展
unsigned short-->float先转换到long然后再转换到float
unsigned short-->double先转换到long然后再转换到double
unsigned short-->long double先转换到long然后再转换到long double
unsigned long-->char保留低字节
unsigned long-->unsigned char保留低字节
unsigned long-->short保留低字节
unsigned long-->unsigned short保留低字节
unsigned long-->long最高位作为符号位
unsigned long-->float转换到long再转换到float
unsigned long-->double直接转换到double
unsigned long-->long double转换到long再转换到long double

 

参考文章:
1、http://www.leskysoft.com/bbs/dispbbs.asp?boardid=5&id=1&page=1&star=1

符号位扩展问题总结
 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值