嵌入式Linux--内存管理单元MMU

平台:JZ2440

地址映射
首先来看两个简单的程序

//hello.c
#include <stdio.h>

int a = 3;

int main(int argc, char *argv[])
{
    printf("Hello World!\n");
    printf("a's address = %p, val = %d\n", &a, a);
    while(1);
    return 0;
}
//hello2.c
#include <stdio.h>

int a = 3;

int main(int argc, char *argv[])
{
    printf("Hello World2!\n");
    printf("a's address = %p, val = %d\n", &a, a);
    while(1);
    return 0;
}

编译运行后结果如下图:
这里写图片描述
(这里讲一个小插曲,我用的是Linux系统,在shell中执行,而shell有行缓存机制,也就是printf不足一行的内容是不会打印出来的,之前程序中第二句printf结尾没有加’\n’,导致a的地址和值一直打印不出来)
两个独立的程序同时运行,a的地址都是一样的,为什么会这样?
这其中存在着地址映射,下面用一张图来说明问题:
这里写图片描述
a的地址0x601040其实是一个虚拟地址,通过相应的地址映射转换成实际的物理地址,这样让两个程序看上去好像在同一空间里跑一样,其实他们都有自己独立的地址空间,互相不能访问。
我们在写程序时提到的地址一般也都是虚拟地址(也不排除时物理地址,如果没有启用地址映射,那就是物理地址),CPU从程序中读出地址,发送读写数据指令,此时读出的地址是虚拟地址,经过地址映射转换成物理地址,读取数据后返回给CPU。进行虚拟地址和物理地址转换的模块,叫做MMU–内存管理单元。
地址映射总结起来就是下面这张图:
这里写图片描述
当没有启用地址映射时,CPU操作的都是实际的物理地址;启用了地址映射以后,CPU操作的是间接地址–虚拟地址。可想而知,地址映射可以将不连续的物理地址映射到连续的虚拟地址上供CPU操作。

讲了这么多地址映射的概念,那到底是怎么完成地址映射的呢?
地址映射可以有两种方法:
1、虚拟地址(VA)和物理地址(PA)通过一定的书写表达式转换:VA = fun(PA),
2、通过一张表,将虚拟地址和物理地址的对应存放起来,这样的表叫做页表页表由一个个条目组成,每个条目存储了一段虚拟地址对应的物理地址,及其访问权限,或者下一级页表的地址,在ARM的CPU中使用第二种方法,我们就来讲讲最简单的段映射。
段映射可以通俗的理解为页表被分成一段一段的内容,每一段的大小是1M,段里面存放的内容是实际的物理地址,则一段代表1M的物理地址。这里写图片描述
需要注意的是每个段的起始地址都是1M的整数倍
那么我们该如何建立映射呢?总共分为三步:
1、建立映射表格
2、将映射表格的地址告诉MMU
3、启动MMU
下面通过程序详细讲解这三步:
程序有一下内容这里写图片描述

  • head.S是启动程序,用汇编代码编写
  • init.c用于初始化存储、mmu等相关内容
  • leds.c是用户的应用程序
  • mmu.lds是一个连接文件,里面说明了上述三个文件应该运行在哪些地址中
  • Makefile是Linux特有的文件,用于定义编译规则,不是本次关注的重点
    首先来讲讲链接文件mmu.lds,先贴代码
SECTIONS { 
  firtst    0x00000000 : { head.o init.o }
  second    0xB0004000 : AT(2048) { leds.o }
} 

我们可以看到他将程序分成了两个段
- first:包含head.S和init.c编译后的文件,他们运行在虚拟地址0x00000000处
- second:包含实际的应用程序,它运行在虚拟地址0xB0004000
其中second段中还有一个AT(2048)这样的东西,这又是什么呢?
我们程序编译完成后会制作成一个mmu.bin文件烧写到开发板上运行,假如说first在mmu.bin文件中的位置是0x00000000处,那么second就位于文件的first+2048处,AT(2048)也就是距离first的偏移量。这里写图片描述

启动文件head.S:

@*************************************************************************
@ File:head.S
@ 功能:设置SDRAM,将第二部分代码复制到SDRAM,设置页表,启动MMU,
@       然后跳到SDRAM继续执行
@*************************************************************************       

.text
.global _start
_start:
    ldr sp, =4096                       @ 设置栈指针,以下都是C函数,调用前需要设好栈
    bl  disable_watch_dog               @ 关闭WATCHDOG,否则CPU会不断重启
    bl  memsetup                        @ 设置存储控制器以使用SDRAM
    bl  copy_2th_to_sdram               @ 将第二部分代码复制到SDRAM
    bl  create_page_table               @ 设置页表
    bl  mmu_init                        @ 启动MMU
    ldr sp, =0xB4000000                 @ 重设栈指针,指向SDRAM顶端(使用虚拟地址)
    ldr pc, =0xB0004000                 @ 跳到SDRAM中继续执行第二部分代码
    @ ldr pc, =main
halt_loop:
    b   halt_loop

启动文件第一步做的是设置栈,它将栈设置在了片内SRAM的顶部;接着关闭看门狗。
下面是设置存储控制器以使用SDRAM,我们的映射表和应用程序leds.c就是在SDRAM中。我们就来看一下memsetup函数,在init.c中:

void memsetup(void)
{
    /* SDRAM 13个寄存器的值 */
    unsigned long  const    mem_cfg_val[]={ 0x22011110,     //BWSCON
                                            0x00000700,     //BANKCON0
                                            0x00000700,     //BANKCON1
                                            0x00000700,     //BANKCON2
                                            0x00000700,     //BANKCON3  
                                            0x00000700,     //BANKCON4
                                            0x00000700,     //BANKCON5
                                            0x00018005,     //BANKCON6
                                            0x00018005,     //BANKCON7
                                            0x008C07A3,     //REFRESH
                                            0x000000B1,     //BANKSIZE
                                            0x00000030,     //MRSRB6
                                            0x00000030,     //MRSRB7
                                    };
    int     i = 0;
    volatile unsigned long *p = (volatile unsigned long *)MEM_CTL_BASE;
    for(; i < 13; i++)
        p[i] = mem_cfg_val[i];
}

我们可以看到程序中将13个值一次填入存储控制器相关的寄存器,这一系列的操作可以理解为配置存储控制器从而可以让我们使用SDRAM,这13个值具体是什么含义可以参考S3C2440A的芯片手册。
让我们回过头来再看head.S,执行完memsetup后接着执行copy_2th_to_sdram函数,将second段拷贝到SDRAM中,同样代码在init.c文件中:

void copy_2th_to_sdram(void)
{
    unsigned int *pdwSrc  = (unsigned int *)2048;
    unsigned int *pdwDest = (unsigned int *)0x30004000;

    while (pdwSrc < (unsigned int *)4096)
    {
        *pdwDest = *pdwSrc;
        pdwDest++;
        pdwSrc++;
    }
}

在讲这个之前想简单讲一讲NAND Flash启动的流程:
我们编译好的程序mmu.bin存放在nand flash的0地址处,当内核开始运行时,会自动将nand的头4K内容拷贝到片内的4k大小SRAM中运行,也就是将head.o、init.o和leds.o拷贝到了内存当中,其中head.o位于内存0地址处,那么leds.o就位于2048处,所以拷贝工作从内存的2048处开始,直到内存结尾,将内容拷贝到SDRAM的0x30004000处。
可是不是说好second段要运行在0xB0004000处吗,怎么又在0x30004000处了,崩溃!那是因为0xB0004000是虚拟地址,我们之后会把0x30004000映射到0xB0004000地址上,也就是说这两个地址指向的都是同一处。

拷贝完second段以后启动文件又告诉CPU该执行create_page_table函数了,这个也就是今天的主角,制作映射表!

/*
 * 设置页表
 */
void create_page_table(void)
{

/* 
 * 用于段描述符的一些宏定义
 */ 
#define MMU_FULL_ACCESS     (3 << 10)   /* 访问权限 */
#define MMU_DOMAIN          (0 << 5)    /* 属于哪个域 */
#define MMU_SPECIAL         (1 << 4)    /* 必须是1 */
#define MMU_CACHEABLE       (1 << 3)    /* cacheable */
#define MMU_BUFFERABLE      (1 << 2)    /* bufferable */
#define MMU_SECTION         (2)         /* 表示这是段描述符 */
#define MMU_SECDESC         (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_SECTION)
#define MMU_SECDESC_WB      (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | \
                             MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE    0x00100000

    unsigned long virtuladdr, physicaladdr;
    unsigned long *mmu_tlb_base = (unsigned long *)0x30000000;

    /*
     * Steppingstone的起始物理地址为0,第一部分程序的起始运行地址也是0,
     * 为了在开启MMU后仍能运行第一部分的程序,
     * 将0~1M的虚拟地址映射到同样的物理地址
     */
    virtuladdr = 0;
    physicaladdr = 0;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC_WB;

    /*
     * 0x56000000是GPIO寄存器的起始物理地址,
     * GPFCON和GPFDAT这两个寄存器的物理地址0x56000050、0x56000054,
     * 为了在第二部分程序中能以地址0xA0000050、0xA0000054来操作GPFCON、GPFDAT,
     * 把从0xA0000000开始的1M虚拟地址空间映射到从0x56000000开始的1M物理地址空间
     */
    virtuladdr = 0xA0000000;
    physicaladdr = 0x56000000;
    *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                            MMU_SECDESC;

    /*
     * SDRAM的物理地址范围是0x30000000~0x33FFFFFF,
     * 将虚拟地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上,
     * 总共64M,涉及64个段描述符
     */
    virtuladdr = 0xB0000000;
    physicaladdr = 0x30000000;
    while (virtuladdr < 0xB4000000)
    {
        *(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | \
                                                MMU_SECDESC_WB;
        virtuladdr += 0x100000;
        physicaladdr += 0x100000;
    }
}

我们总共设置了三段地址映射,第一段是将物理地址0x00000000映射到虚拟地址0x00000000,因为first“应该”运行在0x00000000,所以我们将first的物理地址(0x00000000)映射到虚拟地址0x00000000处,假如first实际 的地址不在0x00000000处,那么就要将它的实际地址映射到虚拟0x00000000处,保证让cpu认为他是在0x00000000处;第二段是映射GPF的寄存器地址,我们知道要使led闪烁需要操作它的寄存器来设置它的输出值,只就需要知道寄存器的具体地址(物理地址),当我们把它们映射到虚拟地址时,我们只需要操作虚拟地址就可以访问到他们,GPFCON的物理地址是0x56000050,GPFDAT的物理地址是0x56000054,将他们映射到0xA0000050和0xA0000054上;第三段是将SDRAM的地址映射到0xB0000000上,这样我们的second段就在0xB0004000地址上了。

设置完映射表以后就有启动MMU啦,贴上代码:

void mmu_init(void)
{
    unsigned long ttb = 0x30000000;

// ARM体系架构与编程
// 嵌入汇编:LINUX内核完全注释
__asm__(
    "mov    r0, #0\n"
    "mcr    p15, 0, r0, c7, c7, 0\n"    /* 使无效ICaches和DCaches */

    "mcr    p15, 0, r0, c7, c10, 4\n"   /* drain write buffer on v4 */
    "mcr    p15, 0, r0, c8, c7, 0\n"    /* 使无效指令、数据TLB */

    "mov    r4, %0\n"                   /* r4 = 页表基址 */
    "mcr    p15, 0, r4, c2, c0, 0\n"    /* 设置页表基址寄存器 */

    "mvn    r0, #0\n"                   
    "mcr    p15, 0, r0, c3, c0, 0\n"    /* 域访问控制寄存器设为0xFFFFFFFF,
                                         * 不进行权限检查 
                                         */    
    /* 
     * 对于控制寄存器,先读出其值,在这基础上修改感兴趣的位,
     * 然后再写入
     */
    "mrc    p15, 0, r0, c1, c0, 0\n"    /* 读出控制寄存器的值 */

    /* 控制寄存器的低16位含义为:.RVI ..RS B... .CAM
     * R : 表示换出Cache中的条目时使用的算法,
     *     0 = Random replacement;1 = Round robin replacement
     * V : 表示异常向量表所在的位置,
     *     0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
     * I : 0 = 关闭ICaches;1 = 开启ICaches
     * R、S : 用来与页表中的描述符一起确定内存的访问权限
     * B : 0 = CPU为小字节序;1 = CPU为大字节序
     * C : 0 = 关闭DCaches;1 = 开启DCaches
     * A : 0 = 数据访问时不进行地址对齐检查;1 = 数据访问时进行地址对齐检查
     * M : 0 = 关闭MMU;1 = 开启MMU
     */

    /*  
     * 先清除不需要的位,往下若需要则重新设置它们    
     */
                                        /* .RVI ..RS B... .CAM */ 
    "bic    r0, r0, #0x3000\n"          /* ..11 .... .... .... 清除V、I位 */
    "bic    r0, r0, #0x0300\n"          /* .... ..11 .... .... 清除R、S位 */
    "bic    r0, r0, #0x0087\n"          /* .... .... 1... .111 清除B/C/A/M */

    /*
     * 设置需要的位
     */
    "orr    r0, r0, #0x0002\n"          /* .... .... .... ..1. 开启对齐检查 */
    "orr    r0, r0, #0x0004\n"          /* .... .... .... .1.. 开启DCaches */
    "orr    r0, r0, #0x1000\n"          /* ...1 .... .... .... 开启ICaches */
    "orr    r0, r0, #0x0001\n"          /* .... .... .... ...1 使能MMU */

    "mcr    p15, 0, r0, c1, c0, 0\n"    /* 将修改的值写入控制寄存器 */
    : /* 无输出 */
    : "r" (ttb) );
}

注意程序开始有一句话:

unsigned long ttb = 0x30000000;

这句话是存储我们映射表的地址,在之后的操作中会告诉MMU。其他的指令可以查看相关资料,推荐《ARM体系架构与编程》。

初始化完MMU以后,把sp指针指向0xB4000000,此时这个地址就是虚拟地址了,它指向虚拟内存的顶部,pc指针指向0xB0004000,这是我们存放leds.o的地方,也就是跳向了main函数。

完成以后系统就会执行leds.c中的内容,操作led灯,我们发现使用虚拟内存后灯闪烁的更快了,那是应为MMU有DCACH和ICACH功能,加快程序的运行

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值