1. GCC 内嵌汇编的基本格式
asm("assembly code");
如:
asm("syscall"); //触发一个系统调用
如果有多条指令,则需在指令尾部添加'\t'和'\n',如:
asm("li v0, 4011\t\n" "syscall");
括号里的字符串 GCC 前端不作分析,直接传给汇编器 as ,故而相联指令间需插入换行符。
'\t' 加入只为排版对齐一些而已,可以使用 gcc -S tst.c -o tst.s 查看生成的 tst.s
因为 GCC 并不对 asm 后括号中的指令作分析,故而如果指令修改一些的寄存器的值,GCC是不知道的,这个会引入一些问题。另外 asm 可以替换为 __asm__ ,效果等价。__asm__ 一般用于头文件中,防止关键字 asm 可能与一些变量、函数名冲突。
内嵌汇编如何与 C 变量交换数据?
2. GCC 内嵌汇编扩展格式
asm (
"assembly code"
: output_operand /* 输出参数列表 */
: input_operand /* 输入参数列表 */
: clobbered_operand /* 被改变的操作对象列表 */
);
以一个例子来说明:
如果我们要读取CP0 25 号硬件计数寄存器的值,并返回之,可以这样:
int get_counter()
{
int rst;
asm( /* mfc0 为取cp0 寄存器值的指令 */
"mfc0 %0, $25\t\n" /* %0 表示列表开始的第一个寄存器 */
: "=r" (rst) /* 告诉gcc 让rst对应一个通用寄存器 */
);
return rst;
}
"=r" 中,'=' 为修饰符,表示该操作对象只写,一般用于修饰输出参数列表中。'r' 表示任意一个通用寄存器。
由于我们只要取得一个值,故而只用到了输出列表。代码中也没修改一些寄存器的值gcc不知道,(输出、输入列表中的寄存器gcc是知道的)故而被改变的操作对象列表亦可省去。
如果我们要重设CP0 24 号硬件计数器之控制寄存器的值,则:
unsigned int op = 0x80f;
asm volatile(
"mtc0 %0, $24"
: /* 没有输出,列表为空 */
:"r"(op) /* 输入参数,告诉gcc 让op对应一个通用寄存器 */
);
volatile 关键字表示让GCC优化生成代码时,不要移动、删除我们的汇编码。另外 __volatile__与其含义相同,引入的目的与__asm__是一样的。
如果我们重设后,立即读取CP0 24号寄存器的值,则:
unsigned int rst;
unsigned int op = 0x80f;
asm volatile(
"mtc0 %1, $24\t\n" /* %1 表示 op 对应的寄存器 */
"mfc0 %0, $25\t\n" /* %0 表示 rst 对应的寄存器 */
: "=r" (rst)
: "r" (op)
);
如果我们要操作的对象位于存储器中,我们可以使用 'm' 来修饰输入输出参数,如:
unsigned short data[] = {
0x0, 0x0, 0x0, 0x0,
0x1, 0x3, 0x5, 0x7,
0x1, 0x3, 0x5, 0x7,
};
void pmullh()
{
asm volatile
(
".set mips3\n\t"
".set noreorder\n\t"
"ldc1 $f0, %1\n\t" /* 取 data+4 处的四个数组元素值到 f0 中 */
"ldc1 $f2, %2\n\t" /* 对应输入列表的 *(data+8) */
/* %2 编译后会替换成类似 16($12) 的形式 */
"pmullh $f2, $f2, $f0\n\t" /* 按16位为单位数据相乘,取结果的低位 */
"sdc1 $f2, %0\n\t" /* 将结果写入data的前四个位置 */
".set reorder\n\t"
".set mips0\n\t"
: "=m"(*data)
: "m"(*(data+4)), "m"(*(data+8))
: "$f0", "$f2", "memory"
);
}
注意到使用'm'修饰的操作数,后面括号里跟的不是指针,而是开始的第一个元素值。
%0,%1, %2 依次对应输出列表的一个,输入列表的两个操作数,编译后会被gcc替换成类似 0($12),8($12),16($12)的形式,其中$12置数组首地址,即: %0等价于0($12)
由于我们嵌入的代码改变了 $f0, $f2 的值,而他们不在输出、输入列表中,故而要将其陈列于被改变操作数列表(clobbered operand list)中,以告诉gcc 我们改变了他们的值,以免gcc 误判。
因为代码中我们改变了内存中数据的值,如果此前gcc生成的代码读取了该内存处的值,并保存于寄存器中的话,由于我们更新了这段数据,所以需要告诉gcc在后面要重新加载数据,这个需要在被改变操作数列表中(clobbered operand list)写入 "memory"。
3. 修饰符
= 只写,常用于修饰所有输出操作数
+ 只读
& 只用于输出,一般和'='一起用,如:"=&r" (val)
4. 其他对输入、输出对象的操作符
可以参看gcc doc 之 5.36 节(Constraints for `asm' Operands)获取更多信息,下面列出MIPS 平台专用的操作符:
`d' General-purpose integer register
`f' Floating-point register (if available)
`h'`Hi' register
`l'`Lo' register
`x'`Hi' or `Lo' register
`y'General-purpose integer register
`z'Floating-point status register
`I'Signed 16-bit constant (for arithmetic instructions)
`J'Zero
`K'Zero-extended 16-bit constant (for logic instructions)
`L'Constant with low 16 bits zero (can be loaded with `lui')
`M' 32-bit constant which requires two instructions to load (aconstant which is not `I', `K', or `L')
`N' Negative 16-bit constant
`O' Exact power of two
`P' Positive 16-bit constant
`G' Floating point zero
`Q' Memory reference that can be loaded with more than one instruction (`m' is preferable for `asm' statements)
`R' Memory reference that can be loaded with one instruction (`m' is preferable for `asm' statements)
`S' Memory reference in external OSF/rose PIC format (`m' is preferable for `asm' statements)
5. 32位下传递64位数据
A. 读取:
long long counter;
asm(
".set mips3\n\t"
"dmfc0 %M0, $25\n\t"
"dsll %L0, %M0, 32\n\t"
"dsrl %M0, %M0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
".set mips0\n\t"
: "=r" (counter)
);
B. 写入
long long counter = 0x0000001000000100;
asm(
".set mips3\n\t"
"dsll %L0, %L0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
"dsll %M0, %M0, 32\n\t"
"or %L0, %L0, %M0\n\t"
"dmtc0 %L0, $25\n\t"
".set mips0\n\t"
: "=r" (counter)
);
asm("assembly code");
如:
asm("syscall"); //触发一个系统调用
如果有多条指令,则需在指令尾部添加'\t'和'\n',如:
asm("li v0, 4011\t\n" "syscall");
括号里的字符串 GCC 前端不作分析,直接传给汇编器 as ,故而相联指令间需插入换行符。
'\t' 加入只为排版对齐一些而已,可以使用 gcc -S tst.c -o tst.s 查看生成的 tst.s
因为 GCC 并不对 asm 后括号中的指令作分析,故而如果指令修改一些的寄存器的值,GCC是不知道的,这个会引入一些问题。另外 asm 可以替换为 __asm__ ,效果等价。__asm__ 一般用于头文件中,防止关键字 asm 可能与一些变量、函数名冲突。
内嵌汇编如何与 C 变量交换数据?
2. GCC 内嵌汇编扩展格式
asm (
"assembly code"
: output_operand /* 输出参数列表 */
: input_operand /* 输入参数列表 */
: clobbered_operand /* 被改变的操作对象列表 */
);
以一个例子来说明:
如果我们要读取CP0 25 号硬件计数寄存器的值,并返回之,可以这样:
int get_counter()
{
int rst;
asm( /* mfc0 为取cp0 寄存器值的指令 */
"mfc0 %0, $25\t\n" /* %0 表示列表开始的第一个寄存器 */
: "=r" (rst) /* 告诉gcc 让rst对应一个通用寄存器 */
);
return rst;
}
"=r" 中,'=' 为修饰符,表示该操作对象只写,一般用于修饰输出参数列表中。'r' 表示任意一个通用寄存器。
由于我们只要取得一个值,故而只用到了输出列表。代码中也没修改一些寄存器的值gcc不知道,(输出、输入列表中的寄存器gcc是知道的)故而被改变的操作对象列表亦可省去。
如果我们要重设CP0 24 号硬件计数器之控制寄存器的值,则:
unsigned int op = 0x80f;
asm volatile(
"mtc0 %0, $24"
: /* 没有输出,列表为空 */
:"r"(op) /* 输入参数,告诉gcc 让op对应一个通用寄存器 */
);
volatile 关键字表示让GCC优化生成代码时,不要移动、删除我们的汇编码。另外 __volatile__与其含义相同,引入的目的与__asm__是一样的。
如果我们重设后,立即读取CP0 24号寄存器的值,则:
unsigned int rst;
unsigned int op = 0x80f;
asm volatile(
"mtc0 %1, $24\t\n" /* %1 表示 op 对应的寄存器 */
"mfc0 %0, $25\t\n" /* %0 表示 rst 对应的寄存器 */
: "=r" (rst)
: "r" (op)
);
如果我们要操作的对象位于存储器中,我们可以使用 'm' 来修饰输入输出参数,如:
unsigned short data[] = {
0x0, 0x0, 0x0, 0x0,
0x1, 0x3, 0x5, 0x7,
0x1, 0x3, 0x5, 0x7,
};
void pmullh()
{
asm volatile
(
".set mips3\n\t"
".set noreorder\n\t"
"ldc1 $f0, %1\n\t" /* 取 data+4 处的四个数组元素值到 f0 中 */
"ldc1 $f2, %2\n\t" /* 对应输入列表的 *(data+8) */
/* %2 编译后会替换成类似 16($12) 的形式 */
"pmullh $f2, $f2, $f0\n\t" /* 按16位为单位数据相乘,取结果的低位 */
"sdc1 $f2, %0\n\t" /* 将结果写入data的前四个位置 */
".set reorder\n\t"
".set mips0\n\t"
: "=m"(*data)
: "m"(*(data+4)), "m"(*(data+8))
: "$f0", "$f2", "memory"
);
}
注意到使用'm'修饰的操作数,后面括号里跟的不是指针,而是开始的第一个元素值。
%0,%1, %2 依次对应输出列表的一个,输入列表的两个操作数,编译后会被gcc替换成类似 0($12),8($12),16($12)的形式,其中$12置数组首地址,即: %0等价于0($12)
由于我们嵌入的代码改变了 $f0, $f2 的值,而他们不在输出、输入列表中,故而要将其陈列于被改变操作数列表(clobbered operand list)中,以告诉gcc 我们改变了他们的值,以免gcc 误判。
因为代码中我们改变了内存中数据的值,如果此前gcc生成的代码读取了该内存处的值,并保存于寄存器中的话,由于我们更新了这段数据,所以需要告诉gcc在后面要重新加载数据,这个需要在被改变操作数列表中(clobbered operand list)写入 "memory"。
3. 修饰符
= 只写,常用于修饰所有输出操作数
+ 只读
& 只用于输出,一般和'='一起用,如:"=&r" (val)
4. 其他对输入、输出对象的操作符
可以参看gcc doc 之 5.36 节(Constraints for `asm' Operands)获取更多信息,下面列出MIPS 平台专用的操作符:
`d' General-purpose integer register
`f' Floating-point register (if available)
`h'`Hi' register
`l'`Lo' register
`x'`Hi' or `Lo' register
`y'General-purpose integer register
`z'Floating-point status register
`I'Signed 16-bit constant (for arithmetic instructions)
`J'Zero
`K'Zero-extended 16-bit constant (for logic instructions)
`L'Constant with low 16 bits zero (can be loaded with `lui')
`M' 32-bit constant which requires two instructions to load (aconstant which is not `I', `K', or `L')
`N' Negative 16-bit constant
`O' Exact power of two
`P' Positive 16-bit constant
`G' Floating point zero
`Q' Memory reference that can be loaded with more than one instruction (`m' is preferable for `asm' statements)
`R' Memory reference that can be loaded with one instruction (`m' is preferable for `asm' statements)
`S' Memory reference in external OSF/rose PIC format (`m' is preferable for `asm' statements)
5. 32位下传递64位数据
A. 读取:
long long counter;
asm(
".set mips3\n\t"
"dmfc0 %M0, $25\n\t"
"dsll %L0, %M0, 32\n\t"
"dsrl %M0, %M0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
".set mips0\n\t"
: "=r" (counter)
);
B. 写入
long long counter = 0x0000001000000100;
asm(
".set mips3\n\t"
"dsll %L0, %L0, 32\n\t"
"dsrl %L0, %L0, 32\n\t"
"dsll %M0, %M0, 32\n\t"
"or %L0, %L0, %M0\n\t"
"dmtc0 %L0, $25\n\t"
".set mips0\n\t"
: "=r" (counter)
);