title: 第四章 第一个程序
date: 2021-08-01 14:48:03
tags: 汇编语言笔记
categories: 汇编语言笔记
在工作室好哥哥们的影响下,也开始喜欢用博客记录自己的学习过程了。
https://afanbird.github.io/
个人博客的地址,由于可能不久之后会换电脑,暂且就不更新在个人博客上了(怕迁移麻烦),用CSDN更新,后面转载到个人博客上面的时候,也会方便很多。笔记是自己在学习中的汇编语言第三版书上的重点知识。之所以记录下来,也是为了自己以后复习知识的时候,能方便的复习。如有不对的地方,欢迎各位师傅指出,若有什么想法,也可以讨论交流,一起学习进步。
第4章 第一个程序
现在我们将开始编写完整的汇编语言程序,用编译和连接程序将它们编译连接成为可执行文件(如*.exe文件),在操作系统中运行。
4.1 一个源程序从写出到执行的过程
第一步:编写汇编源程序
使用文本编辑器(如Edit、记事本等),用汇编语言编写汇编源程序。
这一步工作的结果是产生了一个存储源程序的文本文件。
第二步:对源程序进行编译连接
使用汇编语言编译程序对源程序文件中的源程序进行编译,产生目标文件;
再用连接程序对目标文件进行连接,生成可在操作系统中直接运行的可执行文件。
可执行文件包含两部分内容。
程序(从源程序中的汇编指令翻译过来的机器码)和数据(源程序中定义的数据)
相关的描述信息(比如,程序有多大、要占用多少内存空间等)
这一步的工作结果:产生了一个可在操作系统中运行的可执行文件
第三步:执行可执行文件中的程序
在操作系统中,执行可执行文件中的程序。
操作系统依照可执行文件中的描述信息,将可执行文件中的机器码和数据加载入内存,并进行相关的初始化(比如设置CS:IP指向第一条要执行的指令),然后由CPU执行程序。
4.2 源程序(几条伪指令)
1.伪指令
在汇编语言源程序中,包含两种指令,一种是汇编指令,一种是伪指令。
汇编指令是有对应的机器码的指令,可以被编译为机器指令,最终为CPU所执行。
而伪指令没有对应的机器指令,最终不被CPU所执行。
那么谁来执行伪指令呢﹖
伪指令是由编译器来执行的指令,编译器根据伪指令来进行相关的编译工作。
(1)、 XXX segment
:
:
:
XXX ends
segment 和 ends是一对成对使用的伪指令,
这是在写可被编译器编译的汇编程序时,必须要用到的一对伪指令。
segment和 ends 的功能是定义一个段,segment 说明一个段开始,ends 说明一个段结束。一个段必须有一个名称来标识,
使用格式为:
段名 segment
:
段名 ends
比如,程序4.1中的:
codesg segment ;定义一个段,段的名称是“codesg”。这个段从此开始
:
codesg ends ;名称为“codesg”的段到此结束
一个有意义的汇编程序中至少要有一个段,这个段用来存放代码。
(2)、end
end是以一个汇编程序的结尾标记,编译器在编译汇编程序的过程中,如果碰到了伪指令end。就结束对源程序的编译。否则,编译器在编译程序时,无法知道程序在何处结束。
(3)、assume
这条伪指令的含义为“假设”。
它假设某一段寄存器和程序中的某一个用segment…ends定义的段相关联。通过assume说明这种关联,在需要的情况下,编译程序可以将段寄存器和某一个具体的段相联系。
比如在程序4.1中,
我们用codesg segment…codesg ends定义了一个名为codseg的段,在这个段中存放代码,所以这个段是一个代码段。在程序的开头,用assume cs:codesg将用作代码段的段codesg和CPU中的段寄存器CS联系起来。
\2. 源程序中的“程序”
用汇编语言写的源程序,包括伪指令和汇编指令,我们编程的最终目的是让计算机完成一定的任务。
源程序中的汇编指令组成了最终由计算机执行的程序,
而源程序中的伪指令是由编译器来处理的,它们并不实现我们编程的最终目的。
这里所说的程序就是指源程序中最终由计算机执行、处理的指令或数据。
注意,以后可以将源程序文件中的所有内容称为源程序,
将源程序中最终由计算机执行、处理的指令或数据,称为程序。
程序最先以汇编指令的形式存在源程序中,经编译、连接后转变为机器码,存储在可执行文件中。
\3. 标号
汇编源程序中,除了汇编指令和伪指令外,还有一些标号,
比如“codesg”。一个标号指代了一个地址。比如 codesg在 segment的前面,作为一个段的名称,这个段的名称最终将被编译、连接程序处理为一个段的段地址。
\4. 程序的结构
任务:编程运算2^3。源程序应该怎样来写呢?
(1)我们要定义一个段,名称为abc。
abc segment
:
abc ends
(2)在这个段中写入汇编指令,来实现我们的任务。
abc segment
mov ax ,2
add ax , ax
add ax ,ax
abc ends
(3)然后,要指出程序在何处结束。
abc segment
mov ax ,2 add ax , ax add ax ,ax
abc ends
end
(4)abc被当作代码段来用,所以,应该将abc和 cs 联系起来。(当然,对于这个程序,也不是非这样做不可。)
assume cs:abc
abc segment
mov ax ,2 add ax , ax add ax ,ax
abc endsend
5.程序返回
一个程序P2在可执行文件中,则必须有一个正在运行的程序Pl,将P2从可执行文件中加载入内存后,将CPU的控制权交给P2,P2才能得以运行。P2开始运行后,Pl暂停运行。
而当P2运行完毕后,应该将CPU的控制权交还给使它得以运行的程序Pl,此后,P1继续运行。
现在,我们知道,一个程序结束后,将CPU的控制权交还给使它得以运行的程序,
我们称这个过程为:程序返回。
那么,如何返回呢﹖应该在程序的末尾添加返回的程序段。
mov ax,4C00H
int 21H
6.语法错误和逻辑错误
一般说来,程序在编译时被编译器发现的错误是语法错误
在源程序编译后,在运行时发生的错误是逻辑错误。
4.3编辑源程序
可以用任意的文本编辑器来编辑源程序,只要最终将其存储为纯文本文件即可。
4.4编译
完成对源程序的编辑后,得到一个源程序文件 xxx.asm,可以对其进行编译,生成包含机器代码的目标文件(xxx.obj)。
还有两个中间结果,列表文件(.lst)、交叉引用文件(.crf)。这里不讨论这两个。
4.5 连接
在对源程序进行编译得到目标文件(.obj)后,我们需要对目标文件进行连接,从而得到可执行文件(.exe)。
对xxx.asm 编译 得到 xxx.obj 连接 得到 xxx.exe
连接的作用:
(1)当源程序很大时,可以将它分为多个源程序文件来编译,每个源程序编译成为目标文件后,再用连接程序将它们连接到一起,生成一个可执行文件;
(2)·程序中调用了某个库文件中的子程序,需要将这个库文件和该程序生成的目标文件连接到一起,生成一个可执行文件;
(3)一个源程序编译后,得到了存有机器码的目标文件,目标文件中的有些内容还不能直接用来生成可执行文件,连接程序将这些内容处理为最终的可执行信息。所以,在只有一个源程序文件,而又不需要调用某个库中的子程序的情况下,也必须用连接程序对目标文件进行处理,生成可执行文件。
注意,对于连接的过程,可执行文件是我们要得到的最终结果。
4.6 以简化的方式进行编译和连接(略过)
注意图4.15中的命令行“masm c:\1;”
在masm后面加上被编译的源程序文件的路径、文件名,在命令行的结尾再加上分号,按 Enter键后,编译器就对c:1.asm进行编译,在当前路径下生成目标文件1.obj,并在编译的过程中自动忽略中间文件的生成。
4.7 1.exe的执行(略过)
程序当然是运行了,只是从屏幕上不可能看到任何运行结果,因为,我们的程序根本没有向显示器输出任何信息。程序只是做了一些将数据送入寄存器和加法的操作,而这些事情,我们不可能从显示屏上看出来。程序执行完成后,返回,屏幕上再次出现操作系统的提示符(图4.17中第2行)。
4.8 谁将可执行文件中的程序装载进入内存并使它运行
我们在前面讲过,
在 DOS中,
可执行文件中的程序P1若要运行,必须有一个正在运行的程序P2,
将P1从可执行文件中加载入内存,将CPU的控制权交给它,P1才能得以运行;
当P1运行完毕后,应该将CPU的控制权交还给使它得以运行的程序P2。
问题4.1
此时,有一个正在运行的程序将1.exe 中的程序加载入内存,这个正在运行的程序是什么?它将程序加载入内存后,如何使程序得以运行?
问题4.2
程序运行结束后,返回哪里?
(1)在 DOS中直接执行1.exe时,是正在运行的command,将 1.exe中的程序加载入内存;
(2) command设置CPU的 CS:IP指向程序的第一条指令(即程序的入口),从而使程序得以运行;
(3)程序运行结束后,返回到command中,CPU继续运行command。
汇编从写出 到执行的过程:编程→1.asm →编译一1.obj一连接一1.exe→加载→内存中的程序→运行(Edit) (masm) (link) (command) (CPU)
操作系统的外壳(command)重要,cmd的工作原理
操作系统是由多个功能模块组成的庞大、复杂的软件系统。
任何通用的操作系统,都要提供一个称为shell(外壳)的程序,用户(操作人员)使用这个程序来操作计算机系统进行工作。
DOS中有一个程序command.com,这个程序在 DOS中称为命令解释器,也就是DOS系统的 shell。
DOS启动时,先完成其他重要的初始化工作,然后运行command.com,command.com运行后,执行完其他的相关任务后,在屏幕上显示出由当前盘符和当前路径组成的提示符,比如:“c:”或“c:lwindows”等,然后等待用户的输入。
用户可以输入所要执行的命令,比如,cd、dir、type等,这些命令由command执行,command 执行完这些命令后,再次显示由当前盘符和当前路径组成的提示符,等待用户的输入。
如果用户要执行一个程序,则输入该程序的可执行文件(.exe)的名称,
command首先根据文件名找到可执行文件,
然后将这个可执行文件中的程序加载入内存,设置CS:IP指向程序的入口。
此后,command 暂停运行,CPU 运行程序。程序运行结束后,返回到 command中,command再次显示由当前盘符和当前路径组成的提示符,等待用户的输入。
在 DOS中,command处理各种输入:命令或要执行的程序的文件名。我们就是通过command来进行工作的。
4.9 程序执行过程的跟踪
可以用Debug 来跟踪一个程序的运行过程,这通常是必须要做的工作。我们写的程序在逻辑上不一定总是正确,对于简单的错误,仔细检查一下源程序就可以发现;而对于隐藏较深的错误,就必须对程序的执行过程进行跟踪分析才容易发现。
下面以在前面的内容中生成的可执行文件1.exe为例,讲解如何用Debug对程序的执行过程进行跟踪。
现在我们知道,在 DOS 中运行一个程序的时候,是由command 将程序从可执行文件中加载入内存,并使其得以执行。
但是,这样我们不能逐条指令地看到程序的执行过程,因为command 的程序加载,设置CS:IP指向程序的入口的操作是连续完成的,
而当CS:IP一指向程序的入口,command就放弃了CPU的控制权,CPU立即开始运行程序,直至程序结束。
为了观察程序的运行过程,可以使用Debug。Debug 可以将程序加载入内存,设置CS:IP指向程序的入口,但 Debug 并不放弃对 CPU 的控制,这样,我们就可以使用Debug 的相关命令来单步执行程序,查看每一条指令的执行结果。
运行一个程序的时候,是由command 将程序从可执行文件中加载入内存,并使其得以执行。
但是,这样我们不能逐条指令地看到程序的执行过程,因为command 的程序加载,设置CS:IP指向程序的入口的操作是连续完成的,
而当CS:IP一指向程序的入口,command就放弃了CPU的控制权,CPU立即开始运行程序,直至程序结束。
为了观察程序的运行过程,可以使用Debug。Debug 可以将程序加载入内存,设置CS:IP指向程序的入口,但 Debug 并不放弃对 CPU 的控制,这样,我们就可以使用Debug 的相关命令来单步执行程序,查看每一条指令的执行结果。