什么是OpCode?
不管计算机技术的发展如何日新月异,其最基本的东西是不会突然改变的。OpCode就是这其中的一样东西——因此,Bill Gates的这句话用在这里并不太合适。
在开始回答什么是OpCode之前,请让我先来提几个小问题。
- 计算机只认识0和1吗?
- 如果上面的回答是“是”,那么我们平时写的程序源代码是0和1吗?
- 如果上面的回答是“不是”,那么计算机是怎么“知道”我们的程序的意思的?
按顺序作答,依次是:
- 是
- 不是
- ???
最后一个问题的答案是……?我们来举个例子,在汇编语言中:
NOP
这条指令很简单,是吧?
在编译的时候,Assembler会扫描整个源代码。
在前面我们已经知道了,由于计算机只认识0和1,所以,源代码“NOP”是无法直接运行的。当Assembler遇到“NOP”的时候,为了生成让计算机能运行的“东西”(暂且这样称呼吧),就会以十六进制数“0x90”来代替它。
在这里,“0x90”就是“OpCode”,而“NOP”则是“助记符(mnemonic)”。
OpCode的全称 OpCode就是Operation Code,意即操作码的意思。 |
一个OpCode只对应一个助记符吗?
示例:OpCode && mnemonic | |||||||
OpCode | mnemonic | ||||||
0x90 | NOP | ||||||
0x90 | XCHG AX, AX | ||||||
0x90 | XCHG EAX, EAX |
从上表中可以看出,同一个OpCode可以对应N个mnemonic。为什么会这样呢?原因现在不必深究,以后自然会明白的。
一个助记符只对应一个OpCode吗?
示例:OpCode && mnemonic | |||||||
mnemonic | OpCode | ||||||
ADD EAX, 1 | 0x83C001 | ||||||
ADD EAX, 1 | 0x0501000000 | ||||||
ADD EAX, 1 | 0x81C001000000 |
从上表中也可以看出,同一个mnemonic可以对应多个OpCode。原因同样留待以后再说。
OpCode与mnemonic的关系 一个OpCode不只对应一个mnemonic。 一个mnemonic不只对应一个OpCode。 |
OpCode管中窥豹
有6个域是OpCode可能会用到的,或者说OpCode是由这6个域组成的——不过请注意:它们的名字是什么,这并不重要——重要的是它们的排列顺序。
它们是:
- Prefixes
- code
- ModR/M
- SIB
- Displacement
- Immediate
OpCode的这6个域的详细介绍留待以后再说,现在首先要知道:
在实际的使用中,并不是这所有的6个域都会被用到的,但是有一项却是一定会有的,那就是第2项:code,有些指令甚至只会用到code这一项。 |
例如:
OpCode && mnemonic | |||||||||
OpCode | mnemonic | ||||||||
0xC3 | RETN | ||||||||
0x2F | DAS | ||||||||
0x90 | NOP | ||||||||
0xAC | LODSB |
上表中的几个OpCode都只用到了code这一项。其中的最后一项:0xAC,让我们来看看能不能给它加上一些额外的“东西”:
0xF3AC REP LODSB
可以看到:rep lodsb
为什么会多了个“rep”呢?是不是由额外的“F3”造成的呢?
Yes,猜对了,我们来看看它的OpCode格式描述,如下:(注:用{}包围起来的是域的名称)
AC -- {code}
F3 AC -- {Prefix}{code}
因此,F3 就是域 Prefix
在稍后的章节中我们会知道,F3表示的是Rep Prefix,它也能与movsb,stosb等指令联用,但是,具体细节在这里暂不深究。
让我再来强调一次:OpCode中的6个域是可选的(除了域code之外),不必都用上,但是code是一定会有的。
更精彩内容请参考:http://www.luocong.com/learningopcode/index.htm