目录
前言
在上一篇文章【C语言】操作符总结(一)中我们对大部分的操作符进行了讲解,在这篇文章中我们来解决剩下一小部分的问题,即:逗号表达式、下标引用、函数调用和结构成员以及表达式求值。
一、逗号表达式
1、基本使用
其基本运用格式为:
exp1,exp2,exp3,...,expN
逗号表达式,就是用逗号隔开的多个表达式。
逗号表达式,从左向右依次执行。整个表达式的结果是最后一个表达式的结果。
案例如下:
#include <stdio.h>
int main()
{
int a = 3;
int b = 5;
int c = 0;
int d = (c = 5, a = c + 3, b = a - 4, c += 5);
printf("%d\n", d);
return 0;
}
给d赋值的用括号括起来的就是逗号表达式,运行过程如下:
2、进阶使用
要求:将下方代码功能通过逗号表达式实现
a = get_val();
count_val(a);
while (a > 0)
{
//业务处理
a = get_val();
count_val(a);
}
使用逗号表达式实现为:
while (a = get_val(), count_val(a), a>0)
{
//业务处理
}
二、下标引用、函数调用和结构成员
1、[ ]下标引用操作符
操作数:一个数组名 + 一个索引值
int arr[10]; //创建数组
arr[9] = 10; //实用下标引用操作符
[ ]的两个操作数是arr和9。
2、( )函数调用操作符
接受一个或者多个操作数:第一个操作数是函数名,剩余的操作数就是传递给函数的参数。
#include <stdio.h>
void test1()
{
printf("hehe\n");
}
void test2(const char *str)
{
printf("%s\n", str);
}
int main()
{
test1(); //实用()作为函数调用操作符。
test2("hello bit."); //实用()作为函数调用操作符。
return 0;
}
3、访问一个结构的成员
访问一个结构的成员有两种方式:
. 结构体.成员名
-> 结构体->成员名
通过这两种方法我们可以访问结构体成员,并对结构体成员进行赋值、打印等操作
代码举例:
#include <stdio.h>
struct Stu
{
char name[10];
int age;
char sex[5];
double score;
};
void set_age1(struct Stu stu)
{
stu.age = 18;
}
void set_age2(struct Stu* pStu)
{
pStu->age = 18;//结构成员访问
}
int main()
{
struct Stu stu;
struct Stu* pStu = &stu;//结构成员访问
stu.age = 20;//结构成员访问
set_age1(stu);
pStu->age = 20;//结构成员访问
set_age2(pStu);
return 0;
}
三、表达式求值
到此,我们已经学习了许多的操作符,我们在之后的使用时不可避免的需要在一个表达式中同时使用多个操作符,而操作符执行的顺序问题需要我们仔细学习。表达式求值的顺序一部分是由操作符的优先级和结合性决定。同样,有些表达式的操作数在求值的过程中可能需要转换为其他类型。
1、隐式类型转换
1)整型提升基本概念
C的整型算术运算总是至少以缺省整型类型的精度来进行的。为了获得这个精度,表达式中的字符和短整型操作数在使用之前被转换为普通整型,这种转换称为整型提升。
例子:
//实例1
char a,b,c;
...
a = b + c;
b与c的值被提升为普通整型,然后再去执行加法运算。加法运算结束后得到的是一个整型,存入不了char类型中,因此得到的结果将被截断,然后再存储于a中。
2)整型提升的意义
表达式的整型运算要在CPU的相应运算器件内执行,CPU内整型运算器(ALU)的操作数的字节长度
一般就是int的字节长度,同时也是CPU的通用寄存器的长度。因此,即使两个char类型的相加,在CPU执行时实际上也要先转换为CPU内整型操作数的标准长度。
通用CPU(general-purpose CPU)是难以直接实现两个8比特字节直接相加运算(虽然机器指令
中可能有这种字节相加指令)。所以,表达式中各种长度可能小于int长度的整型值,都必须先转
换为int或unsigned int,然后才能送入CPU去执行运算。
3)整型提升的方式
整型提升是按照变量的数据类型的符号位来提升的
我们来看一段代码:
#include <stdio.h>
int main()
{
char a = 3;
char b = 127;
char c = a + b;
printf("%d\n", c);
return 0;
}
因为3为整型所以它的二进制为:00000000 00000000 00000000 00000011。而char字符类型只能存放一个字节,即8个比特位,即最终低字节存入到a中——00000011。同理127的二进制为:00000000 00000000 00000000 01111111,低字节存入到char类型的b中——01111111。
当对a与b进行求和运算时,a与b都为char类型变量,因此需要进行整型提升,根据上述的整型提升的规则:按照变量的数据类型的符号位来提升的。即提升后的a与b(a、b都为正数)如下:
a:00000000 00000000 00000000 00000011
b:00000000 00000000 00000000 011111111
对a、b进行整型提升后才会进行求和(逢2进1)得到c,即c为:
00000000 00000000 00000000 10000010
因为c也为char字符类型,也只能存放一个字节,故c中存放的二进制位:10000010
我们最后的要求是以整型的形式打印,即最后需要对c进行整型提升(负数整型提升补符号位即1)。我们上面对二进制的一些列操作都是对其补码进行操作,我们还需要进行补码到反码,反码到原码的过程,如下:
11111111 11111111 11111111 10000010 ——c的补码
11111111 11111111 11111111 10000001 ——c的反码
10000000 00000000 00000000 01111110 ——c的原码
根据c的原码可得,最后运行的结果为:-126
总结:
- 负数的整型提升——补1
- 正数的整型提升——补0
- 无符号整型提升——补0
注意:表达式不仅仅是加减乘除运算,还有可能是“==”,!等等,当char、short进行这些运算时也是需要整型提升。
2、算术转换
如果某个操作符的各个操作数属于不同的类型,那么除非其中一个操作数的转换为另一个操作数的类型,否则操作就无法进行。下面的层次体系称为寻常算术转换。
long double
double
float
unsigned long int
long int
unsigned int
int
如果某个操作数的类型在上面这个列表中排名较低,那么首先要转换为另外一个操作数的类型后执行运算。即下可以转上,上不能转下
例如当两个操作数中一个为int类型,而另一个为long int类型,那么就需要把int类型转换成long int类型,这是系统可以帮我们完成的,无需我们自己操作。
注意:算数转换要合理,不然会有一些潜在的问题。
float f = 3.14;
int num = f;//隐式转换,会有精度丢失
3、操作符的属性
复杂表达式的求值有三个影响的因素。
- 操作符的优先级
- 操作符的结合性
- 是否控制求值顺序。
两个相邻的操作符先执行哪个?取决于他们的优先级。如果两者的优先级相同,取决于他们的结合性。
操作 符 | 描述 | 用法示例 | 结果类 型 | 结合 性 | 是否控制求值 顺序 |
() | 聚组 | (表达式) | 与表达 式同 | N/A | 否 |
() | 函数调用 | rexp(rexp,...,rexp) | rexp | L-R | 否 |
[ ] | 下标引用 | rexp[rexp] | lexp | L-R | 否 |
. | 访问结构成员 | lexp.member_name | lexp | L-R | 否 |
-> | 访问结构指针成员 | rexp->member_name | lexp | L-R | 否 |
++ | 后缀自增 | lexp ++ | rexp | L-R | 否 |
-- | 后缀自减 | lexp -- | rexp | L-R | 否 |
! | 逻辑反 | ! rexp | rexp | R-L | 否 |
~ | 按位取反 | ~ rexp | rexp | R-L | 否 |
+ | 单目,表示正值 | + rexp | rexp | R-L | 否 |
- | 单目,表示负值 | - rexp | rexp | R-L | 否 |
++ | 前缀自增 | ++ lexp | rexp | R-L | 否 |
-- | 前缀自减 | -- lexp | rexp | R-L | 否 |
* | 间接访问 | * rexp | lexp | R-L | 否 |
& | 取地址 | & lexp | rexp | R-L | 否 |
sizeof | 取其长度,以字节 表示 | sizeof rexp sizeof(类 型) | rexp | R-L | 否 |
(类 型) | 类型转换 | (类型) rexp | rexp | R-L | 否 |
* | 乘法 | rexp * rexp | rexp | L-R | 否 |
/ | 除法 | rexp / rexp | rexp | L-R | 否 |
% | 整数取余 | rexp % rexp | rexp | L-R | 否 |
+ | 加法 | rexp + rexp | rexp | L-R | 否 |
- | 减法 | rexp - rexp | rexp | L-R | 否 |
<< | 左移位 | rexp << rexp | rexp | L-R | 否 |
>> | 右移位 | rexp >> rexp | rexp | L-R | 否 |
> | 大于 | rexp > rexp | rexp | L-R | 否 |
>= | 大于等于 | rexp >= rexp | rexp | L-R | 否 |
< | 小于 | rexp < rexp | rexp | L-R | 否 |
<= | 小于等于 | rexp <= rexp | rexp | L-R | 否 |
== | 等于 | rexp == rexp | rexp | L-R | 否 |
!= | 不等于 | rexp != rexp | rexp | L-R | 否 |
& | 位与 | rexp & rexp | rexp | L-R | 否 |
^ | 位异或 | rexp ^ rexp | rexp | L-R | 否 |
| | 位或 | rexp | rexp | rexp | L-R | 否 |
&& | 逻辑与 | rexp && rexp | rexp | L-R | 是 |
|| | 逻辑或 | rexp || rexp | rexp | L-R | 是 |
? : | 条件操作符 | rexp ? rexp : rexp | rexp | N/A | 是 |
= | 赋值 | lexp = rexp | rexp | R-L | 否 |
+= | 以...加 | lexp += rexp | rexp | R-L | 否 |
-= | 以...减 | lexp -= rexp | rexp | R-L | 否 |
*= | 以...乘 | lexp *= rexp | rexp | R-L | 否 |
/= | 以...除 | lexp /= rexp | rexp | R-L | 否 |
%= | 以...取模 | lexp %= rexp | rexp | R-L | 否 |
<<= | 以...左移 | lexp <<= rexp | rexp | R-L | 否 |
>>= | 以...右移 | lexp >>= rexp | rexp | R-L | 否 |
&= | 以...与 | lexp &= rexp | rexp | R-L | 否 |
^= | 以...异或 | lexp ^= rexp | rexp | R-L | 否 |
|= | 以...或 | lexp |= rexp | rexp | R-L | 否 |
, | 逗号 | rexp,rexp | rexp | L-R | 是 |
一些有问题的表达式:
代码一:
a*b + c*d + e*f;
该表达式在运算时,由于*比+的优先级高,只能保证,*的计算是比+早,但是优先级并不
能决定第三个*比第一个+早执行。
即其可能的顺序为:
a*b
c*d
a*b + c*d
e*f
a*b + c*d + e*f
或者:a*b
c*d
e*f
a*b + c*d
a*b + c*d + e*f
代码二:
c + --c;
同上,操作符的优先级只能决定自减--的运算在+的运算的前面,但是我们并没有办法得
知,+操作符的左操作数的获取在右操作数之前还是之后求值,所以结果是不可预测的,是有歧义
的。
代码三:
int main()
{
int i = 10;
i = i-- - --i * ( i = -3 ) * i++ + ++i;
printf("i = %d\n", i);
return 0;
}
//非法表达式
该代码在不同的编译器中有不同的结果:非法表达式程序的结果
值 | 编译器 |
—128 | Tandy 6000 Xenix 3.2 |
—95 | Think C 5.02(Macintosh) |
—86 | IBM PowerPC AIX 3.2.5 |
—85 | Sun Sparc cc(K&C编译器) |
—63 | gcc,HP_UX 9.0,Power C 2.0.0 |
4 | Sun Sparc acc(K&C编译器) |
21 | Turbo C/C++ 4.5 |
22 | FreeBSD 2.1 R |
30 | Dec Alpha OSF1 2.0 |
36 | Dec VAX/VMS |
42 | Microsoft C 5.1 |
代码四:
int fun()
{
static int count = 1;
return ++count;
}
int main()
{
int answer;
answer = fun() - fun() * fun();
printf( "%d\n", answer);//输出多少?
return 0;
}
上述代码 answer = fun() - fun() * fun(); 中我们只能通过操作符的优先级得知:先算乘法,
再算减法。但是函数的调用先后顺序无法通过操作符的优先级确定。
代码五:
#include <stdio.h>
int main()
{
int i = 1;
int ret = (++i) + (++i) + (++i);
printf("%d\n", ret);
printf("%d\n", i);
return 0;
}
Linux环境运行结果:
vs2019运行结果:
这段代码中的第一个 + 在执行的时候,第三个++是否执行,这个是不确定的,因为依靠操作符的优先级和结合性是无法决定第一个 + 和第三个前置 ++ 的先后顺序。
总结:我们写出的表达式如果不能通过操作符的属性确定唯一的计算路径,那这个表达式就是存在问题的,我们要避免写出有歧义的表达式。