隐式类型转换
C的整型算术运算总是至少以缺省整型类型的精度来进行的。为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。
整型提升的意义:表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度
一般就是int的字节长度,同时也是CPU的通用寄存器的长度。
因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。
通用CPU(general-purposeCPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsigned int,然后才能送入CPU去执行运算。
实例:
char a,b,c;
...
a = b + c;
b和c的值被提升为普通整型,然后再执行加法运算。
加法运算完成之后,结果将被截断,然后再存储于a中。
如何进行提升的?
整形提升是按照变量的数据类型的符号位来提升的,具体如下
//负数的整形提升
char c1 = -1;
变量c1的二进制位(补码)中只有8个比特位:
1111111
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为1
提升之后的结果是:
11111111111111111111111111111111
//正数的整形提升
char c2 = 1;
变量c2的二进制位(补码)中只有8个比特位:
00000001
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为0
提升之后的结果是:
00000000000000000000000000000001
//无符号整形提升,高位补0
实例1:
int main()
{
char a=3;//a是1byte-8bit
//00000000000000000000000000000011
//00000011-a在内存中的实际存储
char b=127;//b是1byte-8bit
//00000000000000000000000001111111
//01111111-b在内存中的实际存储
//从最低位开始进行截断
//a和b都是char类型,自身大小都是1byte,所以这里计算的时候要进行整型提升
//00000000000000000000000000000011
//00000000000000000000000001111111
//00000000000000000000000010000000
char c=a+b;
//10000010-c
//发生整型提升
//11111111111111111111111110000010-补码(在内存的形式)
//11111111111111111111111110000001-反码
//10000000000000000000000001111110-原码(-126)
}
实例2、
int main()
{
char a = 0xb6;
//11010110
//以高位1为符号位进行整型提升,得到
//11111111111111111111111111010110
short b = 0xb600;
//b为short类型,大小为两个字节也要发生整型提升
int c = 0xb6000000;
//c为int类型,大小为四个字节,不需要整型提升,即0xb6000000为本身的值
if(a==0xb6)
printf("a");
if(b==0xb600)
printf("b");
if(c==0xb6000000)
printf("c");
return 0;
}
算术转换
如果某个操作符的各个操作数属于不同的类型,那么除非其中一个操作数的转换为另一个操作数的类型,否则操作就无法进行。下面的层次体系称为寻常算术转换。
long double
double
float
unsigned long int
long int
unsigned int
int
如果某个操作数的类型在上面这个列表中排名较低,那么首先要转换为另外一个操作数的类型后执行运算。
算术转换实例:
int main()
{
int a=0;
float b=3.14f;
float s=a+b;
//a先算术转换成float类型,然后和b进行计算
}
警告: 但是算术转换要合理,要不然会有一些潜在的问题。
float f = 3.14;
int num= f;//隐式转换,会有精度丢失
操作符的属性
复杂表达式的求值有三个影响的因素:
1、操作符的优先级
2、操作符的结合性:从左到右或从右到左
3、是否控制求值顺序。
两个相邻的操作符先执行哪个?取决于他们的优先级。如果两者的优先级相同,取决于他们的结合性。
注意:即使掌握了表达式求值的规律和顺序,一些表达式也无法求出确切的值。如下面表达式
//表达式的求值部分由操作符的优先级决定。
//表达式1
a*b + c*d + e*f
注释:代码1在计算的时候,由于比+的优先级高,只能保证
的计算是比+早,但是优先级并不
能决定第三个*比第一个+早执行。
所以表达式的计算机顺序就可能是:
a*b
c*d
a*b + c*d
e*f
a*b + c*d + e*f
或者:
a*b
c*d
e*f
a*b + c*d
a*b + c*d + e*f
//表达式2
c + --c;
注释:同上,操作符的优先级只能决定自减–的运算在+的运算的前面,但是我们并没有办法得知,+操作符的左操作数的获取在右操作数之前还是之后求值,所以结果是不可预测的,是有歧义的。
表达式3
int main()
{
int a=1;
int d=0;
d=(++a)+(++a)+(++a);
}
解析:这是在VS2019编译器中的汇编过程,把a的值放到eax中,给eax增加1,再将eax挪回到a,此时a为2;把a在放到ecx中,给ecx增加1,a变成3;再将a放到edx中,给edx加1,把edx的值挪回a,a变成4,把a的值放到eax中,给eax加个a,在加个a;得到12将eax的值挪到d中
这段代码中的第一个 + 在执行的时候,第三个++是否执行,这个是不确定的,因为依靠操作符的优先级 和结合性是无法决定第一个 + 和第三个前置 ++ 的先后顺序。
//代码4
int fun()
{
static int count = 1;
return ++count;
}
int main()
{
int answer;
answer = fun() - fun() * fun();
//- *逻辑清晰,但三个函数先调用的那个无法确定
printf( "%d\n", answer);//输出多少?
return 0;
}
虽然在大多数的编译器上求得结果都是相同的。
但是上述代码 answer = fun() - fun() *fun();中我们只能通过操作符的优先级得知:先算乘法, 再算减法。
函数的调用先后顺序无法通过操作符的优先级确定。
总结:我们写出的表达式如果不能通过操作符的属性确定唯一的计算路径,那这个表达式就是存在问题的。