TC3xx Overlay应用分析：使用Cachable地址出现数据不一致

本文链接：https://blog.csdn.net/djkeyzx/article/details/139044783

1.Overlay在Cache地址的问题现象

2. TC1.6.2P的Local Memory

1.Overlay在Cache地址的问题现象

最近有朋友在验证英飞凌TC3xx的Overlay功能时，出现了如下问题：

0x80280000重映射到到0xB0040000，定义一个变量在0x80280000，用a去读，开启Overlay功能之后，理论上来说修改0xB0040000的值，a读到的就是新值，结果a读到的还是原来的值，把cache关掉就正常了。

这里首先反应肯定是Cache数据一致性问题，但是直觉告诉我没有这么简单。再仔细阅读题干并结合手册可以发现：

8H开头的PFlash为Cachable的地址

B0040000对应Non-Cache的LMU

问题来了，既然Overlay映射到了Non-Cache的LMU0，那CPU为什么不直接到LMU去读数据？反而还是以前Cache里的数据呢？

带着这个问题，我们梳理一下Tricore的Memory模型，理清思路后发现问题很简单，但加深了对Tricore的认识。

2. TC1.6.2P的Local Memory

2.1 Local Memory分类

根据UserMannul里的描述，TC1.6的本地memory模型如下：

其中包含了：

PSPR：Program Scratchpad SRAM，为性能需求的代码提供快速、具有确定CPU访问周期的RAM，其特点是存在PSPR的程序是CPU直接取指，不会被Cache；
DSPR：Data Scratchpad SRAM，顾名思义，为数据访问提供高速的RAM
PCache：Program Cache，2路组相连的程序Cache
DCache：Data Cache，2路组相连的数据Cache
DLMU：Distributed LMU memory
LPB：Local PFlash Bank ，本地CPU与目标Flash的直连接口

以TC39x为例，我们可以通过其框图看到memory层级：

其中，CPU访问PSPR、PCACHE、DSPR、DCACHE的速度最快，其次是DLMU、PFI，最后是LMU。Cycle数据总结如下：

这里临时有个想法，如果把Data放到PSPR里，其性能如何呢？要解决这个问题，先得搞清楚CPU的Memory接口类型。

2.2 PMI和DMI

TC1.6的CPU模型如下：

它由IFU(Instruction Fetch Unit)、EU(Execution Unit)、GRP构造，其中指令访问使用PMI接口、数据访问使用DMI接口。

PMI：Program Memory Interface向CPU提供指令流

其中，比较特别的是PLB，一个256bits Program Line Buffer。当使用Non-Cacheable地址时时，为加快速度，PLB可作为单个Cache Line使用。同时注意，上半部分PMI与SRI Master和LPB(PFI)接口是一个单向只读接口，而对于下半部分PSPR、CPS是一个双向接口。

DMI：Data Memory Interface向CPU提供数据或者存储由CPU发送的数据，其框图如下：