一、什么是整形提升?
C的整型算术运算总是至少以缺省整型类型的精度来进行的。
为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。
表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度一般就是int的字节长度,同时也是CPU的通用寄存器的长度。
因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。通用CPU(general-purpose CPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsigned int,然后才能送入CPU去执行运算。
我们先来看一组例子:
void test()
{
char a = -1;
printf("%u\n", a);
}
这里的值不符合我们的预期,我们来分析一下
a中存了什么,按照存储原理,负数最高位符号位为1,在内存中以补码的形式存储所以a里面应该是 11111111。此时以%u(无符号数)打印,即认为1111 1111
是一个正数,输出应该是255,但结果确是4294967295,如果我们把这个数放在计算器里算一下就会发现它的二进制是 1111 1111 1111 1111 1111 1111 1111 1111,32个比特位都是1,即在输出时a不是1字节而是 四字节。这就是整形提升造成的。
总结:整型提升是指在输出或者计算变量时,变量大小不够整型(int型)的大小,则需要把变量的大小提升至整型在进行输出或者计算。
二、如何进行整形提升?
整形提升是按照变量的数据类型的符号位来提升的
//负数的整形提升
char c1 = -1;
变量c1的二进制位(补码)中只有8个比特位:
1111111
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为1
提升之后的结果是:
1111 1111 1111 1111 1111 1111 1111 1111
//正数的整形提升
char c2 = 1;
变量c2的二进制位(补码)中只有8个比特位:
00000001
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为0
提升之后的结果是:
0000 0000 0000 0000 0000 0000 0000 0001
即符号位为0则高位不补0,符号位为1则高位补1
注意:整形提升时看自身类型!
void test()
{
unsigned char a = 255;
printf("%u\n", a);
}
>>255
这个例子中,a的值为255,内存中存储为1111 1111最高位符号位是1,但是由于自身类型是无符号性,默认符号位是0,所以a整形提升过后应该是0000 0000 0000 0000 0000 0000 1111 1111。输出结果依旧是255。
三、实例展示
例1
#include <stdio.h>
int main()
{
char a = 3;
char b = 127;
char c = a + b;
printf("%d\n", c);
return 0;
}
>>-126
为什么c的值等于-126呢?
a=3,3是一个整形,4个字节占32个bit位
00000000 00000000 00000000 00000011 //3的二进制原码
(内存中存储的是补码,整数原反补相同)
而char类型只能存储1个字节,因此存储时要进行截断:
00000011 —a
同理:
b=127,也是一个整形
00000000 00000000 00000000 01111111 // 127的二进制原码
而char类型只能存储1个字节
01111111 —b
那么表达式a和b是如何相加的呢?
a,b进行表达式运算时要进行整型提升
00000000 00000000 00000000 00000011 —a
00000000 00000000 00000000 01111111 —b
a,b这时变成整形,直接进行相加。
00000000 00000000 00000000 10000010 —c
但是c是char类型,只能存1个字节,必须进行截断处理
10000010 ----c
最后c要打印成%d,整形的形式
char类型的c此时就需要再次进行整形提升:
11111111 11111111 11111111 10000010 —c的补码(内存中存储的是补码,所以c没整形提升前符号位是1,因此前面补的是1)
11111111 11111111 11111111 10000001 —c的反码
10000000 00000000 00000000 01111110 —c的原码
原码转换为十进制为 -126
例2
int main()
{
char a = 0xb6;
short b = 0x7600;
int c = 0xb6000000;
if(a==0xb6)
printf("a\n");
if(b==07600)
printf("b\n");
if(c==0xb6000000)
printf("c\n");
return 0;
>>b
>>c
}
这个例子中:
a和b在进行判断时都发生了整形提升 ,不同的是:
- a的最高位(符号位)为1,而自身也是有符号的,所以整形提升后高位补1,最后结果与0xb6不等;
- b的自身类型也是有符号的,最高位为0,整形提升后高位补0,最后结果与0x76相等,输出b,;
- c则不需要整形提升。