在了解PowerPC汇编指令前,需要先看下编程所用的寄存器模型,PowerPC系统结构为大多数运算指令都定义了Register-Register的操作,这些操作的源操作数从寄存器取得,或作为嵌入指令操作码中的立即数提供。这里的e300核可分为用户编程模型和管理员编程模型,该模型有32个GPR、32个FPR、特殊目的寄存器SPR和一些功能寄存器,下图为二者的示意图:
上面这些寄存器可能不太好理解,因为名字和Intel汇编不一样,其实,可以这样理解,GPR就相当于EAX/EBX/ECX,而CTR则完全就是ECX的功能,是吧?区别就是没有堆栈而已咯。CR被分为8段,每段4位,分别代表LT、GT、EQ和SO(小于、大于、等于和溢出);LR用于记录跳转地址;特殊寄存器XER用于记录溢出和进位标志;FPSCR用于记录浮点运算类型和异常等。
再看下指令集,大部分的CPU指令集可分为:数据读写、数值计算、流程控制和设备管理四个部分,由于PowerPC使用RISC,指令字长为32bit,Endian一般是可调的,默认为大端,另外,PowerPC没有栈,所以程序需要自己实现相关操作。首先为运算和逻辑指令,列举如下:
它们与通用寄存器有关,源数据来自GPR 或16 位立即数,目的是GPR 寄存器,操作为32 位,GPR 中存放32 位更新数据。大多数指令都可以根据字面意思理解其作用,注意还有一个“cntlzw”指令,意为计算字中的第一个0,用于在一个字中找到1时将一个指令中的0的数量找出,它在决定例外寄存器中最高优先服务时有用。
下面是数据读写指令,它们对数据在存储器中核通用寄存器中的传送很有用,若数据小于传送长度(单字,半字或字节),指令会使数据变位为32位,将不同位填0或符号扩展。指令列举如下:
这里需要注意的是上面列举的lbz和lhz两个指令并不完全等同于mov al,[ebx]和mov ax,[ebx+10]这两个,因为前面两个是将字节和半字加载到r3时还清空了高位,而后两条指令只是加载数据到eax,并不会清空高位。
另外,还有两个指令sthbrw和stwbrx,对PowerPC存取小端格式数据很有用,它们允许存取这样的数据,若数据以小端顺序进入总线,就把它存为大端顺序。
好了,现在来详细看下赋值指令,下面是最常见的赋值代码:
lis r3,0x1234
addi r3,r3,0x5678
这段代码的含义是将0x12345678加载到寄存器r3中。因为在RISC下,PowerPC的每条指令都是32bit,除去指令和寄存器参数编码,只剩下16bit的长度描述立即数,如立即数加载指令li:
这样立即数SIMM只有16位,所以需要两次加载,使用lis(立即数载入并左移)和addi(立即数加法)两条指令完成。
再看下PowerPC不同的子程序调用:
[cpp] view plaincopyprint?
1. func: /* 子程序入口 */
2. blr /* 返回(跳转到lr地址) */
3. start:
4. bl func /* 调用func(跳转并保存地址到lr) */
5. li r1,1 /* 设置r1、r3 */
6. li r3,1
7. sc /* 系统调用,结束程序 */
func: /* 子程序入口 */
blr /* 返回(跳转到lr地址) */
start:
bl func /* 调用func(跳转并保存地址到lr) */
li r1,1 /* 设置r1、r3 */
li r3,1
sc /* 系统调用,结束程序 */
这里的调用由PowerPC使用lr寄存器完成,在bl指令跳转前,下一条指令li r1,1的地址会被保存在lr,而执行的func中的blr时,系统会跳到lr表示的地址,完成返回。
再来介绍下特殊寄存器的操作指令,它们可以完成特殊用途寄存器之间和通用寄存器之间的数据交换,不可以直接对特殊用途寄存器中的值进行处理,但是,可以将一个值先拷贝到一个通用寄存器上处理,再将信息存到特殊用途寄存器上。下面是指令集合:
这里回顾下,PowerPC里没有堆栈,那用什么实现模拟呢?看下面的例子:
[cpp] view plaincopyprint?
1. f1:
2. mflr r2 /*保存lr中记录的地址到r2*/
3. stw r2,-8(r1) /*记录r2的值到mem[r1-8]*/
4. addi r1,r1,-60 /*r1后移60个字节,完成进栈操作*/
5. ...
6. addi r1,r1,60 /*r1前移60个字节,准备出栈*/
7. lwz r2,-8(r1) /*读出老的lr值到r2*/
8. mtfr r2 /*将r2的内容复制到lr*/
9. blr /*返回(跳转到lr地址)*/
10.start:
11. ...
12. bl f1 /*调用f1(跳转并保持地址到lr)*/
f1:
mflr r2 /*保存lr中记录的地址到r2*/
stw r2,-8(r1) /*记录r2的值到mem[r1-8]*/
addi r1,r1,-60 /*r1后移60个字节,完成进栈操作*/
...
addi r1,r1,60 /*r1前移60个字节,准备出栈*/
lwz r2,-8(r1) /*读出老的lr值到r2*/
mtfr r2 /*将r2的内容复制到lr*/
blr /*返回(跳转到lr地址)*/
start:
...
bl f1 /*调用f1(跳转并保持地址到lr)*/
看到了吧,虽然没有提供栈的相关指令(PUSH/POP/CALL/RET),但应用程序可以用r1模拟栈指针,实现多层调用对LR的记录和恢复。
前面说了,PowerPC指令为32位长,指令内仅有16位用于加载常量值,由于地址最多可达到64位,所以我们可以采用每次一段的方式载入地址,汇编程序中的@符号指示汇编程序给出一个符号值的特殊处理形式:@highest:表示一个常量的第48-63位;@higher:表示一个常量的第32-48位;@h:16-31位;@l:0-15位。
下面是我们的一个稍大点的PowerPC汇编程序总结下上面的指令集,实现的功能就是载入两个值并相加,最后退出,以结果为状态代码输出。代码如下:
[cpp] view plaincopyprint?
1. #sum.s,第一个PowerPC汇编程序
2. .data
3. .align 3
4. #此处装载两个值
5. first_value:
6. .quad 1
7. second_value:
8. .quad 2
9. #写”.opd”(official procedure descriptor)
10..section “.opd”,”aw”
11..align 3
12.#._start的程序描述符,即为程序名
13..global _start
14._start:
15. .quad .start, .TOC.@tocbase,0
16.#._text为程序代码段
17..text
18.._start:
19. #装载地址高位
20.lis r7,first_value@highest
21.ori r7,r7,first_value@higher
22.#shift these up to the high-order bits
23.rldier r7,r7,32,31
24.#装载地址低位
25.oris r7,r7,first_value@h
26.ori r7,r7,first_value@l
27.#将第一个值载入寄存器4
28.ld r4,0(r7)
29.lis r7,second_value@highest
30.ori r7,r7,second_value@higher
31.rldicr r7,r7,32,31
32.oris r7,r7,second_value@h
33.ori r7,r7,second_value@l
34.ld r5,0(r7)
35.#二者相加并存到寄存器6
36.add r6,r4,r5
37.#程序退出
38.li 0,1 #寄存器0为系统调用
39.mr r3,r6 #将结果移到寄存器3中
40.sc #对内核进行系统调用