1. 什么是cache?
基于程序访问的局限性,在主存和CPU 通用寄存器之前设置了一类高速的、容量较小的存储器,把正在执行的指令地址附件的一部分指令或数据从主存调入这类存储器,供CPU 在一段时间内使用,这对提高程序的运行速度有很大的作用。这类介于主存和CPU 之间的高速小容量存储器称作高速cache。
比较常见的cache 包括icache 和dcache。icache 的使用比较简单,系统刚上电时,icache中的内容是无效的,并且icache 的功能是关闭的,往CP15 协处理器中的寄存器1 的bit[12]写1 可以启动icache,写0 可以停止icache。icache 关闭时,CPU 每次取指都要读主存,性能非常低。因为icache 可随时启动,越早开icache 越好。
与icache 相似,系统刚上电时, dcache 中的内容是无效的,并且dcache 的功能是关闭的,往CP15 协处理器中的寄存器1 的bit[2]写1 可以启动dcache,写0 可以停止dcache。因为dcache必须在启动mmu 后才能被启动,而对于裸机而言,没必要开mmu,所以本教程的程序将不会启动dcache。
2. 代码编写
2.1 start.S
.global _start
_start:
//外设基地址及大小告诉CPU
ldr r0, =0x70000000 //ldr: load
orr r0, r0, #0x13 //0x13=b10011=256M, 参见arm1176jzfs内核参考手册Page3-130
mcr p15,0,r0,c15,c2,4 //把r0的值(包括了外设基地址+外设大小)告诉cpu
//关看门狗
ldr r0, =0x7E004000 //watch dog timer base address
mov r1, #0
str r1, [r0] //disable watch dog. str: Store
//设置栈
ldr sp, =0x0C002000 //S3C6410 的内部8K 的SRAM 被映射到0X0C000000,而ARM 默认的栈是递减的,所以可以让SP 指向0X0C002000
//打开icache
orr r0, r0, #0x00001000 @ set bit 12 (I) I-cache
mcr p15, 0, r0, c1, c0, 0
//调用C函数点灯
bl main
halt:
b halt
2.2 main.c
volatile unsigned long *gpkcon0 = (volatile unsigned long *)0x7F008800;
volatile unsigned long *gpkdat = (volatile unsigned long *)0x7F008808;
//延时
void delay(void)
{
volatile int i=0x10000;
while(i--);
}
int main(void)
{
*gpkcon0 = 0x11110000; //设置gpk4、5、6、7为输出
while(1)
{
*gpkdat = 0x00;
delay();
*gpkdat = 0xf0;
delay();
}
}
2.3 Makefile
led.bin: start.o main.o
arm-linux-ld -Ttext 0x50000000 -o led.elf $^
arm-linux-objcopy -O binary led.elf led.bin
arm-linux-objdump -D led.elf > led_elf.dis
%.o : %.S
arm-linux-gcc -o $@ $< -c
%.o : %.c
arm-linux-gcc -o $@ $< -c
clean:
rm *.o *.elf *.bin *.dis -rf