再读内核存储管理(7):icache支持

 
快乐虾
http://blog.csdn.net/lights_joy/
lights@hb165.com
  
 
本文适用于
ADI bf561 DSP
uclinux-2008r1-rc8 (移植到vdsp5)
Visual DSP++ 5.0
  
 
欢迎转载,但请保留作者信息
 
1.1.1   寄存器配置初始化
在内核中,如果要支持icache,必须首先定义一个宏:
#define        CONFIG_BFIN_ICACHE               1
对icache的初始化配置在 arch/blackfin/kernel/cplb-nompu/cacheinit.cbfin_icache_init函数完成:
#if defined(CONFIG_BFIN_ICACHE)
void bfin_icache_init(void)
{
     unsigned long *table = icplb_table;
     unsigned long ctrl;
     int i;
 
     for (i = 0; i < MAX_CPLBS; i++) {
         unsigned long addr = *table++;
         unsigned long data = *table++;
         if (addr == (unsigned long)-1)
              break;
         bfin_write32(ICPLB_ADDR0 + i * 4, addr);
         bfin_write32(ICPLB_DATA0 + i * 4, data);
     }
     ctrl = bfin_read_IMEM_CONTROL();
     ctrl |= IMC | ENICPLB;
     bfin_write_IMEM_CONTROL(ctrl);
     SSYNC();
}
#endif
在这里,
MAX_CPLBS的定义为:
#define MAX_CPLBS (16 * 2)
之所以定义为16*2是因为它把ICPLB_ADDR和ICPLB_DATA交叉存放在一个数组中,因此需要*2。
icplb_table则是一个全局变量,其定义为:
u_long icplb_table[MAX_CPLBS + 1];
最后一个CPLB元素的值为-1(不一定是数组的最后一个元素),用作上述函数中for循环的退出条件。
那么 icplb_table的值从哪来呢?答案在cplbinit.c。
icplb_table的生成是由 generate_cpl_tables实现的。以下代码删除了与icplb初始化化无关的部分:
void __init generate_cpl_tables(void)
{
 
     u16 i, j, process;
     u32 a_start, a_end, as, ae, as_1m;
 
     struct cplb_tab *t_i = NULL;
     struct s_cplb cplb;
 
     cplb.init_i.size = MAX_CPLBS;
     cplb.init_i.pos = 0;
     cplb.init_i.tab = icplb_table;
 
     for (i = ZERO_P; i < ARRAY_SIZE(cplb_data); ++i) {
         if (!cplb_data[i].valid)
              continue;
 
         as = cplb_data[i].start % SIZE_4M;
         ae = cplb_data[i].end % SIZE_4M;
 
         if (as)
              a_start = cplb_data[i].start + (SIZE_4M - (as));
         else
              a_start = cplb_data[i].start;
 
         a_end = cplb_data[i].end - ae;
 
         for (j = INITIAL_T; j <= SWITCH_T; j++) {
 
              switch (j) {
              case INITIAL_T:
                   if (cplb_data[i].attr & INITIAL_T) {
                       t_i = &cplb.init_i;
                       t_d = &cplb.init_d;
                       process = 1;
                   } else
                       process = 0;
                   break;
              default:
                       process = 0;
                   break;
              }
 
              if (!process)
                   continue;
              if (cplb_data[i].attr & I_CPLB)
                   __fill_code_cplbtab(t_i, i, a_start, a_end);
 
         }
     }
 
/* close tables */
 
     close_cplbtab(&cplb.init_i);
     cplb.init_i.tab[cplb.init_i.pos] = -1;
}
在这里cplb_data是在文件头中定义的一个10个元素的数组,它详细说明了每块内存的属性,如大小,类型等等。
当程序运行到 __fill_code_cplbtab时,以下几块将被填入ICPLB的数组中:
     {
         .start = L1_CODE_START,
         .end = L1_CODE_START + L1_CODE_LENGTH,
         .psize = SIZE_4M,
         .attr = INITIAL_T | SWITCH_T | I_CPLB,
         .i_conf = L1_IMEMORY,
         .d_conf = 0,
         .valid = 1,
         .name = "L1 I-Memory",
     },
     {
         .start = 0,
         .end = 0, /* dynamic */
         .psize = 0,
         .attr = INITIAL_T | SWITCH_T | I_CPLB | D_CPLB,
         .i_conf = SDRAM_IGENERIC,
         .d_conf = SDRAM_DGENERIC,
         .valid = 1,
         .name = "Kernel Memory",
     },
其中, Kernel Memory这个块的.end已经设置为SDRAM的结束位置。
这个函数的实现为:
/* helper function */
static void __fill_code_cplbtab(struct cplb_tab *t, int i, u32 a_start, u32 a_end)
{
     if (cplb_data[i].psize) {
         fill_cplbtab(t,
                   cplb_data[i].start,
                   cplb_data[i].end,
                   cplb_data[i].psize,
                   cplb_data[i].i_conf);
     #if defined(CONFIG_BFIN_ICACHE)
         if (ANOMALY_05000263 && i == SDRAM_KERN) {
              fill_cplbtab(t,
                       cplb_data[i].start,
                       cplb_data[i].end,
                       SIZE_4M,
                       cplb_data[i].i_conf);
         } else
#endif
} else {
              fill_cplbtab(t,
                       cplb_data[i].start,
                       a_start,
                       SIZE_1M,
                       cplb_data[i].i_conf);
              fill_cplbtab(t,
                       a_start,
                       a_end,
                       SIZE_4M,
                       cplb_data[i].i_conf);
              fill_cplbtab(t, a_end,
                       cplb_data[i].end,
                       SIZE_1M,
                       cplb_data[i].i_conf);
         }
}
static unsigned short __init
fill_cplbtab(struct cplb_tab *table,
          unsigned long start, unsigned long end,
          unsigned long block_size, unsigned long cplb_data)
{
     int i;
 
     switch (block_size) {
     case SIZE_4M:
         i = 3;
         break;
     case SIZE_1M:
         i = 2;
         break;
     case SIZE_4K:
         i = 1;
         break;
     case SIZE_1K:
     default:
         i = 0;
         break;
     }
 
     cplb_data = (cplb_data & ~(3 << 16)) | (i << 16);
 
     while ((start < end) && (table->pos < table->size)) {
 
         table->tab[table->pos++] = start;
 
         if (lock_kernel_check(start, start + block_size) == IN_KERNEL)
              table->tab[table->pos++] =
                  cplb_data | CPLB_LOCK | CPLB_DIRTY;
         else
              table->tab[table->pos++] = cplb_data;
 
         start += block_size;
     }
     return 0;
}
     {
         .start = L1_CODE_START,
         .end = L1_CODE_START + L1_CODE_LENGTH,
         .psize = SIZE_4M,
         .attr = INITIAL_T | SWITCH_T | I_CPLB,
         .i_conf = L1_IMEMORY,
         .d_conf = 0,
         .valid = 1,
         .name = "L1 I-Memory",
     },
这个块传递进来时,它将直接调用
         fill_cplbtab(t,
                   cplb_data[i].start,
                   cplb_data[i].end,
                   cplb_data[i].psize,
                   cplb_data[i].i_conf);
从fill_cplbtab这个函数可以看出此时ICPLB_ADDR的值将为 L1_CODE_START,也就是0xffa0 0000,而ICPLB_DATA的值将为0x0003 0007,这个值的意义是:
16位和17位的值为11,即页面大小为4M。
第0位,也即CPLB_VALID,为1,表示Valid CPLB Entry。
第1位,也即CPLB_LOCK,为1,表示CPLB Entry Should not be replaced。
第2位,也即CPLB_USER_RD,为1,表示User mode read access permitted。
     {
         .start = 0,
         .end = 0, /* dynamic */
         .psize = 0,
         .attr = INITIAL_T | SWITCH_T | I_CPLB | D_CPLB,
         .i_conf = SDRAM_IGENERIC,
         .d_conf = SDRAM_DGENERIC,
         .valid = 1,
         .name = "Kernel Memory",
     },
这个块传进来的时候,它将调用
              fill_cplbtab(t,
                       cplb_data[i].start,
                       cplb_data[i].end,
                       SIZE_4M,
                       cplb_data[i].i_conf);
此时将生成15个SDRAM的块,每个都是4M,且从0开始递增。此时它们的CPLB_DATA值将为0x0003 1205,这个值的意义是:
16位和17位的值为11,即页面大小为4M。
第0位,也即CPLB_VALID,为1,表示Valid CPLB Entry。
第1位,也即CPLB_LOCK,为0,表示CPLB Entry can be replaced。
第2位,也即CPLB_USER_RD,为1,表示User mode read access permitted。
第9位,也即CPLB_MEM_LEV,为1,表示Determins Line Buffer, Low Priority。
第12位,也即CPLB_L1_CHBL,为1,表示Cacherable in l1。
很明显,在初始化的时候,当SDRAM>32M时,icache是无法覆盖整个存储空间的,此时,uclinux内核必然会发生I-fetch CPLB miss异常。uclinux内核对这种异常情况的处理由_cplb_mgr完成,这个函数在 arch/blackfin/kernel/cplb-nompu/cplbmgr.S中,它将在整个存储区域的配置列表中寻找一个合适的块,替换掉ICACHE_DATA15和ICACHE_ADDR15,即它总是替换最新的一个页。
在这里,整个存储区域配置的列表保存在一个叫 ipdt_table的数组中,看看他的定义:
u_long ipdt_table[MAX_SWITCH_I_CPLBS + 1] PDT_ATTR;
/*
* Number of required instruction CPLB switchtable entries
* MEMSIZE / 4 (we mostly install 4M page size CPLBs
* approx 12 for smaller 1MB page size CPLBs for allignment purposes
* 1 for L1 Instruction Memory
* possibly 1 for L2 Instruction Memory
* 1 for CONFIG_DEBUG_HUNT_FOR_ZERO
*/
 
#define MAX_SWITCH_I_CPLBS (((CONFIG_MEM_SIZE / 4) + 12 + 1 + 1 + 1) * 2)
这个数组同样是交叉保存了ICPLB_ADDR和ICPLB_DATA的值,它的初始化同样由 generate_cpl_tables函数完成,与icplb_table的初始化类似。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
在 Cortex-A7 处理器中,当启用 MMU(内存管理单元)后,对 I-cache(指令缓存)的操作会有一些变化。 1. 缓存一致性(Cache Coherency):启用 MMU 后,处理器会根据页表中的访问权限和属性来管理缓存的一致性。当对内存进行读写操作时,处理器会检查对应的缓存行是否存在且有效。如果存在且有效,那么处理器会先进行一致性检查,并根据需要进行缓存失效、更新或写回操作,以确保数据的一致性。 2. 指令访问权限:启用 MMU 后,指令访问权限也会受到页表的控制。处理器会根据页表中的权限位(例如读、写、执行等)来决定是否允许从缓存中获取指令。如果权限不满足要求,处理器将触发异常,并由操作系统进行相应的处理。 3. TLB(Translation Lookaside Buffer):TLB 是 MMU 中的一个高速缓存,用于加速虚拟地址到物理地址的转换。当启用 MMU 后,处理器会使用 TLB 来缓存虚拟地址到物理地址的映射关系。这样,对于已经在 TLB 中缓存的地址,处理器可以更快地进行地址转换,并从相应的缓存行中获取指令。 需要注意的是,具体的缓存操作和一致性机制会受到操作系统的影响,因为操作系统会管理页表、缓存一致性和 TLB 的维护。因此,在具体应用中,请参考相关处理器手册、操作系统文档和 ARM 架构规范,以了解详细的操作和配置指导。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

嵌云阁主

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值