本人非NOC设计,仅从事DDR相关的驱动开发,这里记录一些遇到的总线设计的缺陷,导致软件卡死的问题。
NOC 设计中 AXI APB slave通过一个NOC做转换
总线卡死,情形1: DDR 做DFS,AXI 到DDR的访问都被block住。
卡死原因:DDR 的变频操作过程中,1操作被hold,导致已发出的2操作无法完成。R5操作DDR寄存器进行变频需经过APB总线,访问被2操作block,DFS过程无法完成,1操作无法完成。总线死锁。
workaround:软件设计锁,保证DFS前 A53无APB寄存器操作。防止此情形发生。
总线卡死,情形2: DDR 带宽压力较大时。
卡死原因:A53/R5 给DDR 非常多写操作(cache flush 等都会有这样的情况),将DDR的写通道打满。 此时发生 2或3 的操作,A53、R5 对APB寄存器进行写访问(通过NOC后,访问转换AXI2APB),A53 先占据APB的访问。R5 对APB写操作 数据无法发出,R5 又有写DDR的命令发出(写数据还未发出)(操作4),DDR arbiter 将R5 port作为最高优先级(A53占据时间较长,被切换到R5)。 此时,DDR 对R5 的写命令响应,但R5无数据发出,DDR 不出来A53的写命令,A53无法释放APB总线,R5无法发出完成APB操作,R5无法发出DDR写数据。总线死锁。
workaround:R5 MPU中对APB区域,设置 strongorder熟悉,保证APB访问完成前,无DDR访问发出。不打断DDR对A53的命令,防止此情形发生。