前言
表达式求值的顺序一部分是由操作符的优先级和结合性决定。
同样,有些表达式的操作数在求值的过程中可能需要转换为其他类型。
一、隐式类型转换(整型提升)
C的整型算术运算总是至少以缺省整型类型的精度来进行的。
为了获得这个精度,表达式中的字符(char)和短整型(short)操作数在使用之前被转换为普通整型(int),这种转换称为整型提升。
整型提升的意义:
表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度一般就是int的字节长度,同时也是CPU的通用寄存器的长度。
因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。
通用CPU(general-purpose CPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转换为int或unsigned int,然后才能送入CPU去执行运算。
举例:
char a = 10;
short b = 20;
short c = a + b;
因为char类型和short类型都比int类型短,因此在计算时,a和b都要先做整型提升再参与运算。整型提升计算后的c也为整型,但因为定义时c为short型,因此计算出的整形结果需要截断成short型才存入c中。
那么如何进行整型提升呢?
整形提升是按照变量的数据类型的符号位来提升的,也就是整型提升的结果和该数的正负有关。
1.负数的整形提升
char c1 = -1;
变量c1的二进制位(补码)中只有8个比特位:
1111111
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为1
提升之后的结果是:
11111111111111111111111111111111
2.正数的整形提升
char c2 = 1;
变量c2的二进制位(补码)中只有8个比特位:
00000001
因为 char 为有符号的 char
所以整形提升的时候,高位补充符号位,即为0
提升之后的结果是:
00000000000000000000000000000001
3.无符号整形提升,高位补0
整型提升示例1:
//示例1
int main()
{
char a = 0xb6;
short b = 0xb600;
int c = 0xb6000000;
if(a==0xb6)
printf("a");
if(b==0xb600)
printf("b");
if(c==0xb6000000)
printf("c");
return 0;
}
本例中,a和b分别为char型和short型数据,在运算时需要进行整型提升,而整型提升后的结果与它们原本的值并不一致。c为int型,计算时不需要进行整型提升,因此值是不变的。所以程序的输出结果为
c
整型提升示例2:
//示例2
int main()
{
char c = 1;
printf("%u\n", sizeof(c));
printf("%u\n", sizeof(+c));
printf("%u\n", sizeof(-c));
return 0;
}
运行结果:
示例2中的c只要参与表达式运算,就会发生整形提升,表达式 +c ,是一个具体的运算或者称之为操作,所以会发生整型提升,而sizeof检测到其类型发生了变化,所以 sizeof(+c) 是4个字节。
表达式 -c 也会发生整形提升,所以 sizeof(-c) 是4个字节,但是 sizeof( c ) ,因为并没有任何运算和操作,其类型不变,还是1个字节。
二、算术转换
如果某个操作符的各个操作数属于不同的类型,那么除非其中一个操作数的转换为另一个操作数的类
型,否则操作就无法进行。下面的层次体系称为寻常算术转换。
long double
double
float
unsigned long int
long int
unsigned int
int
如果某个操作数的类型在上面这个列表中排名较低,那么首先要转换为另外一个操作数的类型后执行操作。
三、操作符的属性(优先级等)
复杂表达式的求值有三个影响的因素。
- 操作符的优先级
- 操作符的结合性
- 是否控制求值顺序。
两个相邻的操作符先执行哪个?取决于他们的优先级。如果两者的优先级相同,取决于他们的结合性。
结合性:比如加法运算的结合性是从左到右,那么对于a+b+c,就是从左到右依次计算。
下表列出了操作符优先级,他们的优先级从上到下依次降低:
详细的操作符优先级解释和大致的记忆方法请参考下面链接及书籍《C和指针》第5章内容
https://www.cnblogs.com/xiehy/archive/2010/02/04/1663825.html
https://www.runoob.com/cprogramming/c-operators.html
问题/垃圾代码
即使我们知晓了这些操作符的优先级和结合性,但仍然会有一些代码让计算机的判断出现偏差。
1.如下,代码1在计算的时候,由于✳比+的优先级高,只能保证✳的计算是比+早,但是优先级并不能决定第三个✳比第一个+早执行。
//表达式的求值部分由操作符的优先级决定。
//代码1
a*b + c*d + e*f
所以表达式的计算机顺序就可能是:
a*b
c*d
a*b + c*d
e*f
a*b + c*d + e*f
或者:
a*b
c*d
e*f
a*b + c*d
a*b + c*d + e*f
如果把a,b,c,d,e,f只简单当作变量的话,这两种顺序其实没有差别。但如果它们表示的是表达式呢?如果它们中某一个或者某几个的运算会影响到其他表达式的值呢?那么运算顺序将变得极其重要,不同的运算顺序自然也会出现不同的结果。
这种现象在后面的几种垃圾代码中也有出现。
//代码2
c + --c;
同上,操作符的优先级只能决定自减–的运算在+的运算的前面,但是我们并没有办法得知,+操作符的左操作数的获取在右操作数之前还是之后求值,所以结果是不可预测的,是有歧义的。
//代码3-非法表达式
int main()
{
int i = 10;
i = i-- - --i * ( i = -3 ) * i++ + ++i;
printf("i = %d\n", i);
return 0;
}
这段代码来自《C和指针》,作者在不同的平台上进行编译运行后得到了不同的结果,因此这种代码无疑是非常应该避免的!
为了达到目的,我们可以把这种代码分开计算,以让计算机明确计算顺序。
//代码4
int fun()
{
static int count = 1;
return ++count;
}
int main()
{
int answer;
answer = fun() - fun() * fun();
printf( "%d\n", answer);//输出多少?
return 0;
}
这段代码同样有问题,在不同的编译环境下得到的结果不同。
因为fun()函数中的count是static修饰的,因此出了函数也不会销毁,所以就有问题了,对于answer = fun() - fun() * fun();
就有了两种执行顺序:
得到的结果自然也不相同!
//代码5
#include <stdio.h>
int main()
{
int i = 1;
int ret = (++i) + (++i) + (++i);
printf("%d\n", ret);
printf("%d\n", i);
return 0;
}
与前面相同的问题,当计算完前两个++i后,有的编译器会选择直接将前两个++i先加起来,再计算最后的部分。有的编译器则会算完++i再将三个++i加起来。得到的结果也是不同的。
总结
因此再实际编程过程中,应该时刻注意不要出现垃圾代码,让每一个操作都清晰明确,不要出现歧义!