图解数据读写与Cache操作

  高速缓存(Cache)主要是为了解决CPU运算速度与内存(Memory)读写速度不匹配的矛盾而存在, 是CPU与内存之间的临时存贮器,容量小,但是交换速度比内存快。

  百度百科是这样介绍缓存读取的:

  CPU要读取一个数据时,首先从Cache中查找,如果找到就立即读取并送给CPU处理;如果没有找到,就用相对慢的速度从内存中读取并送给CPU处理,同时把这个数据所在的数据块调入Cache中,可以使得以后对整块数据的读取都从Cache中进行,不必再调用内存。
  正是这样的读取机制使CPU读取Cache的命中率非常高(大多数CPU可达90%左右),也就是说CPU下一次要读取的数据90%都在Cache中,只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间,也使CPU读取数据时基本无需等待。总的来说,CPU读取数据的顺序是先Cache后内存。

  Cache的硬件实现中通常包含一级Cache(L1 Cache),二级Cache(L2 Cache)甚至多级Cache;对于一级Cache,又有I-Cache(指令缓存)和D-Cache(数据缓存)之分,本文准备不讨论各级Cache的区别以及I-Cache和D-Cache的细节,仅将这些所有实现笼统称为Cache。
  本文仅针对Cache的读写进行简单说明并通过示意图演示什么时候需要写回(flush)缓存,什么时候需要作废(Invalidate)缓存。
  对于指令缓存的I-Cache和数据缓存的D-Cache,平时D-Cache访问比较多,以下主要讨论数据访问的D-Cache,指令缓存I-Cache原理一样。
  

Cache读写原理
  图一、Cache读写原理
  
  写入数据时:
  第一步,CPU将数据写入Cache;
  第二步,将Cache数据传送到Memory中相应的位置;
  读取数据时:
  第一步,将Memory中的数据传送到Cache中;
  第二步,CPU从Cache中读取数据;

  在具体的硬件实现上,Cache有写操作有透写(Write-Through)和回写(Write-Back)两种方式:
  在透写式Cache中,CPU的数据总是写入到内存中,如果对应内存位置的数据在Cache中有一个备份,那么这个备份也要更新,保证内存和Cache中的数据永远同步。所以每次操作总会执行图一中的步骤1和2。
  在回写式Cache中,把要写的数据只写到Cache中,并对Cache对应的位置做一个标记,只在必要的时候才会将数据更新到内存中。所以每次写操作都会执行步骤中的图1,但并不是每次执行步骤1后都执行步骤2操作。
  透写方式存在性能瓶颈,性能低于回写方式,现在的CPU设计基本上都是采用Cache回写方式。

  通常情况下,数据只通过CPU进行访问,每次访问都会经过Cache,此时数据同步不会有问题。
  在有设备进行DMA操作的情况下,设备读写数据不再通过Cache,而是直接访问内存。在设备和CPU读写同一块内存时,所取得的数据可能会不一致,如图二。
  
设备和CPU读写同一块内存时数据不一致
  图二、设备和CPU读写同一块内存时数据不一致

  CPU执行步骤1将数据A写入Cache,但并不是每次都会执行步骤2将数据A同步到内存,导致Cache中的数据A和内存中的数据A’不一致;步骤3中,外部设备通过DMA操作时直接从内存访问数据,从而取得的是A’而不是A。
  设备DMA操作完成后,通过步骤4将数据B写入内存;但是由于内存中的数据不会和Cache自动进行同步,步骤5不会被执行,所以CPU执行步骤3读取时数据时,获取的可能是Cache中的数据B’,而不是内存中的数据B;

  在CPU和外设访问同一片内存区域的情况下,如何操作Cache以确保设备和CPU访问的数据一致就显得尤为重要,见图三。

Cache操作同步数据
  图三、Cache操作同步数据

  CPU执行步骤1将数据A写入Cache,由于设备也需要访问数据A,因此执行步骤2将数据A通过flush 操作同步到内存;步骤3中,外部设备通过DMA操作时直接从内存访问数据A,最终CPU和设备访问的都是相同的数据。
  设备DMA操作完成后,通过步骤4将数据B写入内存;由于CPU也需要访问数据B,访问前通过invalidate操作作废Cache中的数据,从而通过Cache读取数据时Cache会从内存取数据,所以CPU执行步骤6读取数据时,获取到的是从内存更新后的数据;

  Cache操作举例:
  1. 外部设备I/O和DMA传输。
  例如,在博通机顶盒平台中,内存加解密在单独的安全芯片中进行,安全芯片访问的数据通过DMA进行传输操作。因此,在进行内存加解密前,需要flush D-Cache操作将数据同步到到内存中供安全芯片访问;加解密完成后需要执行invalidate D-Cache操作,以确保CPU访问的数据是安全芯片加解密的结果,而不是Cache之前保存的数据;
  DMA进行数据加解密的示例代码:

void mem_dma_desc(
        unsigned long Mode,
        unsigned long SrcAddr, /* input data addr */
        unsigned long DestAddr, /* output data addr */
        unsigned long Slot,
        unsigned long Size) /* dma data size */
    {
        ...prepare for dma encryption/decryption operation...

        /* flush data in SrcAddr from D-Cache to memory 
           to ensure dma device get the correct data */
        flush_d_cache(SrcAddr, Size);

        ...do dma operation, output will be redirect to DestAddr...

        /* invalidate D-Cache to ensure fetch data from memory
           instead of cached data in D-Cache */
        invalidate_d_cache(DestAddr, Size);
        return;
    }

  nand flash的控制器也支持DMA读取的方式。在数据向nand flash写入数据时需要先flash dcache确保DMA操作的数据是真实要写如的数据,而不是内存中已经过期的数据;从nand flash读取数据后需要invalidate dcache,使cache中的数据失效,从而确保cpu读取的是内存数据,而不是上一次访问时缓存的结果。
  nand flash 通过DMA方式读取数据的示例代码:

static int nand_dma_read(
            struct nand_dev *nand,
            uint64_t addr, /* read addr */
            void *buf,     /* output buffer */
            size_t len)
{
    int ret;

    ...prepare for nand flash read and device dma transfer...

    /* flush dma descriptor for nand flash read operation */
    flush_d_cache(descs, ndescs * sizeof(*descs));

    /* nand flash dma read operation */
    ret = nand_dma_run(nand, (uintptr_t)descs);

    /* invalidate read output buffer to ensure fetch data from memory
       instead of cached data in D-Cache */
    invalidate_d_cache(buf, len);

    ...other operations...

    return ret;
}

  2. 通常Cache分为I-Cache和D-Cache,取指令时访问I-Cache,读写数据时访问D-Cache。
  如果一段代码保存在外设(如nand flash或硬盘)上,CPU想执行这段代码,需要先将这段代码作为数据复制到内存再将这段代码作为指令执行。由于写入数据和读取指令分别通过D-Cache和I-Cache,所以需要同步D-Cache和I-Cache,即复制后需要先将D-Cache写回到内存,而且还需要作废当前的I-Cache以确保执行的是Memory内更新的代码,而不是I-Cache中缓存的数据,如图四所示:

CPU复制代码后再执行
  图四、CPU复制代码后执行
  CPU复制代码后执行的示例代码:

void copy_code_and_execution(
        unsigned char *src, 
        unsigned char *dest, 
        size_t len)
{
    ...copy code from src addr to dest addr...

    /* flush instructions data in D-Cache to memory */
    flush_all_d_cache();

    /* invalidate I-Cache to ensure fetch instructions from memory
       instead of cached data in I-Cache */
    invalidate_all_i_cache();

    ...jump to dest address for execution and never return...

    /* actually it never reach here if it jumps to dest successfully */
    printf("failed to jumping...\r\n");

    return; 
}
  • 19
    点赞
  • 47
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

洛奇看世界

一分也是爱~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值