最近在重新学习编程,拿一个“扫雷”的游戏练练手,碰到问题
问题
- 为什么要分.h文件、.c文件?
- 变量声明、定义,函数声明、定义,到底做了什么事?起到什么作用?
key words
-
编程是人对机器的使用、命令,编译器是翻译官
-
编程中使用的变量名、函数名,对于编译器都是陌生的符号
-
声明告诉编译器这些符号的含义
-
声明在回答who的问题,定义回答how的问题
-
“定义”兼具“声明”的功能,任何变量、函数必须先声明后使用
-
编译是以c文件为单位的,编译器是不会编译h文件的
-
#include本身只是一个简单的文件包含预处理命令,即用include的文件的内容代替该行语句
样例
为便于全文的展开,先看看我的“扫雷”工程的内容
-
game.h
#include<time.h> #include<stdio.h> #include<stdlib.h> #define row 12 #define col 12 #define COUNT 12 extern char show_mine[row][col];//玩家数组 extern char real_mine[row][col];//设计者数组 void init_mine();//初始化两个雷阵 void print_player();//打印玩家棋盘 void print_mine();//打印设计者棋盘 、、、、、、 void muen();//菜单函数
-
game.c
#include"game.h" char show_mine[row][col] = { 0 };//只初始化数组中一个元素 char real_mine[row][col] = { 0 }; void muen() { 、、、、、 } void init_mine() { int i = 0; int j = 0; 、、、、、 } 、、、、、、、
-
main.c
#include"game.h" double start, finish; void game() { int ret = 0;//ret是干嘛的 init_mine();//初始化玩家棋盘和设计者棋盘 、、、、、、、 } int main() { 、、、、、 muen();//菜单 、、、、、 }
详细解释
如果没有变量、函数的声明,编译器看这段程序会出现什么问题?
我们知道些程序会用到各种变量名,结构体名,函数名,程序是我们写的,我们当然知道这些标识符的含义,但是编译器看到标识符是一脸懵逼的,比如如果没有各种声明,编译器编译“扫雷”游戏时就有疑问了,init_mine
标识符是什么东西?它是函数还是变量?是变量的话,它是什么类型的?占用几个字节?是函数的话?它有没有传入参数?有几个?什么类型?有没有返回值?里面用到了全局变量了吗?什么类型?什么类型?会不会是结构体或者联合、枚举型?
变量声明和变量定义
变量定义:用于为变量分配存储空间,还可为变量指定初始值。程序中,变量有且仅有一个定义。
变量声明:用于向程序表明变量的类型和名字(这句话可以理解成,变量声明告诉编译器某个符号的类型)。
定义也是声明:当定义变量时我们声明了它的类型和名字。
extern是声明不是定义:通过使用extern关键字声明变量名而不定义它,表示extern变量的定义不在这个文件中,请到其它.c文件中寻找。
变量在使用前必须被被定义或者声明。
在一个程序中,变量只能定义一次,却可以声明多次。
定义分配存储空间,而声明不会。
函数的声明与定义
函数的声明和定义区别比较简单,带有{ }的就是定义,否则就是声明。
函数定义的时候自带声明的性质
函数的声明告诉编译器,函数有哪些传入参数,分别是什么类型,函数有返回值吗,是什么类型。函数的定义告诉编译器函数如何实现
通常头文件中的内容
- 函数声明
- 变量声明
- 宏声明
- 结构体声明
通常c文件的内容
- 变量定义
- 函数
从代码到程序运行
-
编译器预处理
-
将所用的宏名用宏内容替换
-
处理include指令
#include “xx.h” 这个宏其实际意思就是把当前这一行删掉,把 xx.h 中的内容原封不动的插入在当前行的位置
-
-
词法与语法分析
-
编译
首先编译成纯汇编语句,再将之汇编成跟CPU相关的二进制码,生成各个目标文件 (.obj文件)
由于模块包含外部调用,即指向其他模块中的数据或指令的地址,或包含对库函数的引用,编译程序或汇编程序负责记录引用发生位置,其处理结果将产生相应的多个目标模块,每个目标模块都附有供引用使用的内部符号表和外部符号表。符号表中依次给出各个符号名及在本目标模块中的名字地址,在模块被链接时进行转换
程序编译时,不会找某个调用模块的实现,只有在链接时才进行这个工作
我们在.c文件中include.h文件实际是引入里面的声明,使得编译通过,编译器不关心某个函数在哪里实现,怎么实现,关心的是函数的传入参数是什么类型,返回值是什么类型
编译器在编译时是以C文件为单位进行的(也称编译单元),也就是说如果你的项目中一个C文件都没有,那么你的项目将无法编译,所谓的编译单元,是指一个.c文件以及它所include的所有.h文件
-
链接
链接程序的作用是根据目标模块之间的调用和依赖关系,将主调用模块、被调用模块以及所用到的库函数装配和链接成一个可装载执行模块
以上通俗的解释:把编译过程中的符号换成一个个实实在在的“代码段”和变量存储空间
通常,编译器会在每个.obj文件中都去找一下所需要的符号,而不是只在某个文件中找或者说找到一个就不找了。因此,如果在几个不同文件中实现了同一个函数,或者定义了同一个全局变量,链接的时候就会提示"redefined"
链接器是以目标文件为单位,它将一个或多个目标文件进行函数与变量的重定位,生成最终的可执行文件
-
装载
涉及到重定位,此处关系不大,略
现实情况并不是严格按照上述五步进行的,类似于上学的“跳级”
有装载时链接,一边装载一边链接,装载和链接合二为一,被调用代码段在哪儿(内存或外存)就用哪儿的代码
运行时装载和链接,运行装载链接三合一程序运行时,真正用到(指选择语句)哪段代码就去取哪段代码来运行
main()函数的作用
链接时,链接器往往会发现工程中包含很多函数,链接的目的是生成可执行文件,这么多函数从哪里开始执行呢?人为规定从有标识符main的函数处开始执行,main也叫做程序入口点
使用头文件的好处
- 如果在C文件中声明宏,结构体,函数等,那么我要在另一个C文件中引用相应的宏,结构体,就必须再做一次重复的工作,如果我改了一个C文件中的一个声明,那么又忘了改其它C文件中的声明,这不就出了大问题了,程序的逻辑就变成了你不可想象的了,如果把这些公共的东东放在一个头文件中,想用它的C文件就只需要引用一个就OK了!!!这样岂不方便,要改某个声明的时候,只需要动一下头文件就行了
- 在头文件中声明结构体,函数等,当你需要将你的代码封装成一个库,让别人来用你的代码,你又不想公布源码,那么人家如何利用你的库呢?也就是如何利用你的库中的各个函数呢??一种方法是公布源码,别人想怎么用就怎么用,另一种是提供头文件,别人从头文件中看你的函数原型,这样人家才知道如何调用你写的函数,就如同你调用printf函数一样,里面的参数是怎样的??你是怎么知道的??还不是看人家的头文件中的相关声明啊!!!当然这些东东都成了C标准,就算不看人家的头文件,你一样可以知道怎么使
- 头文件能加强类型安全检查。如果某个接口被实现或被使用时,其方式与头文件中的声明不一致,编译器就会指出错误,这一简单的规则能大大减轻程序员调试、改错的负担
头文件使用不当
- 如果在头文件中实现一个函数体,那么如果在多个C文件中引用它,而且又同时编译多个C文件,将其生成的目标文件连接成一个可执行文件,在每个引用此头文件的C文件所生成的目标文件中,都有一份这个函数的代码,如果这段函数又没有定义成局部函数,那么在连接时,就会发现多个相同的函数,就会报错
- 如果在头文件中定义全局变量,并且将此全局变量赋初值,那么在多个引用此头文件的C文件中同样存在相同变量名的拷贝,关键是此变量被赋了初值,所以编译器就会将此变量放入DATA段,最终在连接阶段,会在DATA段中存在多个相同的变量,它无法将这些变量统一成一个变量,也就是仅为此变量分配一个空间,而不是多份空间,假定这个变量在头文件没有赋初值,编译器就会将之放入 BSS段,连接器会对BSS段的多个同名变量仅分配一个存储空间
一些讨论
-
每个.h文件都必须有一个对应的同名.c文件吗?
不需要,c文件名可以任意定义,只要把.h文件include进去就好了。但是通常我们在.h文件写函数声明,在对应同名.c文件写函数实现
-
大家平时
#include<stdio.h>
,那里面的函数(如printf( ))的实现在哪里?首先没有.c文件写这些函数的实现,我推断函数的实现已经编译成目标文件,放在编译器里或者操作系统里
-
我们知道.h文件里内容一般会比较丰富,我们的程序里并没有用到这么多函数,怎么办?有影响吗?
定义有且只能有一次,声明可以有很多次,没用到的东西声明也不会影响啥,就像“过马路,左右两边都看”一样
概念清楚
如果说难题最难的部分是基本概念,可能很多人都会持反对意见,但实际上也确实如此。我高中的时候学物理,老师抓的重点就是概念–概念一定要搞清,于是难题也成了容易题。如果你能分析清楚一道物理难题存在着几个物理过程,每一个过程都遵守那一条物理定律(比如动量守恒、牛II定律、能量守恒),那么就很轻松的根据定律列出这个过程的方程,N个过程必定是N个N元方程,难题也就迎刃而解。即便是高中的物理竞赛难题,最难之处也不过在于:
(1)、混淆你的概念,让你无法分析出几个物理过程,或某个物理过程遵循的那条物理定律;
(2)、存在高次方程,列出方程也解不出。而后者已经是数学的范畴了,所以说,最难之处还在于掌握清晰的概念;
程序设计也是如此,如果概念很清晰,那基本上没什么难题(会难在数学上,比如算法的选择、时间空间与效率的取舍、稳定与资源的平衡上)。但是,要掌握清晰的概念也没那么容易。
搞清楚语法和概念说易也易,说难也难。窍门有三点: 不要晕着头工作,要抽空多思考思考,多看看书;
看书要看好书,问人要问强人。烂书和烂人都会给你一个错误的概念,误导你;
勤能补拙是良训,一分辛苦一分才;
概念清楚很重要,我们要概念清楚,那什么是概念清楚呢?我的老师告诉我:“概念清楚,就是你对着一个问题一直问,问下去,你都可以很清晰的理解和解释,直到它再显然不过了”