龙芯3A4000处理器解读 ②

龙芯3A4000处理器解读 2

第一章简述了3A4000的芯片结构,并对照结构图举例了访问7A的通道,那么本章节主要梳理CPU如何获取到一条分配给到7A的地址如何通过窗口命中正确访问到有效数据.

地址窗口(X1 & X2)

每个Master端口接收到的请求都通过路由配置,然后访问对应的slave端,无论X1还是X2,每个master端口都拥有8个地址窗口,可以完成8个地址窗口的目标路由.
3A4000的 master端 (X1+X2) : CORE0, CORE1, CORE2, CORE3, SCACHE0, SCACHE1, SCACHE2, SCACHE3, IO_L1X(默认写死),IO_L2X, HT0_LO, HT0_HI, MISC, SE, HT1_LO, HT1_HI,以上是可被地址窗口路由的.

地址窗口路由: 假设你想访问一个端口A,而你访问到A必须经过B,那么B如何配置,才可以识别处理器给的地址是访问的A的地址呢,这就相当于一个路由器,所有地址都发到了该端口,再由端口进行分发,该是发往哪个设备的发往哪个设备.

由以上可被地址窗口路由的信息可知: 龙芯3A4000的路由主要通过系统的两级交叉开关与IO-RING实现.
以一个Core为例:

Core0.i \ DataWinBaseWinMaskWinMmap
Core0.0Win0x100000000xffff f80000000x0000 0e00 1000008e
Core0.1Win0x400000000xffff c00000000x0000 0e00 4000008e
Core0.2Win0x180000000xffff fc0000000x0000 0efd fc00008e
Core0.3Win0x1e0000000xffff ff0000000x0000 0e00 0000008e

窗口命中公式: (IN_ADDR & MASK) == BASE
新地址换算公式: OUT_ADDR = (IN_ADDR & ~MASK) | {MMAP[63:10], 10’h0}

我们以目前3A4000上的7A的Pci的IO空间: 0x90000efdfc000000 为例.
IN_ADDR: master上游地址.

缺省配置:

  • 0x0000 0000 ~ 0x0fff ffff 的地址区间(256M)映射到DDR的0x00000000 ~ 0x0fff ffff
  • 0x1000 0000 ~ 0x17ff ffff 映射到桥片的PCI_MEM空间
  • 0x1800 0000 ~ 0x19ff ffff 映射到桥片的PCI_IO空间
  • 0x1a00 0000 ~ 0x1aff ffff 映射到桥片的PCI配置空间(Type0)
  • 0x1b00 0000 ~ 0x1bff ffff 映射到桥片的PCI配置空间(Type1)
  • 0x4000 0000 ~ 0x7fff ffff 映射到桥片的PCI_MEM空间

IN_ADDR: 0x1800 0000 & 0xffff fc00 0000 = 0x1800 0000 可覆盖范围: 0x1800 0000 ~ 0x1bff ffff,
OUT_ADDR: (0x1800 0000 & 0x300 0000) = 0x0 | 0x0000 0efd fc000000 = 0x0000 0efd fc00 0000 0x8e(窗口使能,slave HT1_LO.)
OUT_ADDR 相当于除去开窗口的基地址,将该窗口的偏移大小路由到了另一个地址+该偏移. 0x0efd fc000000就是路由到HT1_LO的地址.
以 0x4000 0000, 0x4000 0000 & 0xffff c000 0000 = 0x4000 0000, 可覆盖的范围 IN_ADDR 0x4000 0000 ~ 0x7fff ffff.

0x0e00 0000 008e: 路由到从设备HT1_LO, HT1_LO接收到的地址是0e00 0000 0000, 然后进行HT窗口命中.
0x0efdfc000000, 0xfd fc00 0000该40位地址如何路由的? 0xfdfc00 0000 在HT1_LO窗口中,命中了内部窗口I/O空间的窗口.

Base是窗口的命中路由的基地址,mask是窗口的大小.

TLB

在LA平台上,当我们写Code时,访问了一个非法地址,一般情况下会出发Tlb例外,即我们访问的地址Cpu不认识。

我们平台上的主存物理地址划分:
0x00000000 - 0x10000000 ==> 0x80000000 - 0x90000000 :低256M内存区域
0x90000000 - MaxMem : 256M以上内存条的Size

我们编写的Code都是给Cpu’s Core看的,而LA平台上电时我们已将Cpu从直接物理地址访问模式切换到了虚实地址映射的方式,所以我们看到只能使用对应的64Bit虚拟地址进行访问。
恰好 0x90000000 - MaxMem 的内存被映射到了 0x8000000090000000 - Max (uncache,不过cache窗口).

所以比较下面两条Asm代码:

li.d a0, 0x8000000090000000
ld.d t0, a0, 0 /*1*/
li.d a0, 0x90000000
ld.d t0, a0, 0 /*2*/

1)可以正常load物理地址为0x90000000(即主存的256M位置的一个64Bit的数据)
2)会触发Tlb例外,说白了就是Core不认识该地址。
那么针对 2 我们怎么操作可以让其识别呢?

  • 1 取消虚实地址映射,但是这样我们64Bit虚地址都会产生地址错误.
  • 2 添加Tlb表项,即当我们再次使用2方式时,MMU会首先将0x90000000的64bit虚拟地址翻译成0x90000000的正确物理地址,然后返回有效数据.
    在这里插入图片描述

固件下Tlb例外后暂时没有操作,即直接异常Assert, CPU记录下异常地址; 而内核中,如果TLB会去查TLB内存表项,然后填表,将进程的虚拟地址切换到一段真正的物理地址(自身理解,有问题请指出).

关于虚拟内存管理技术

随着计算机的发展,应用程序的规模逐渐增大,一个难题出现在程序员的面前,那就是应用程序太大以至于内存容纳不下该程序,通常解决的办法是把程序分割成许多称为覆盖块(overlay)的片段。覆盖块0首先运行,结束时他将调用另一个覆盖块。虽然覆盖块的交换是由OS完成的,但是必须先由程序员把程序先进行分割,这是一个费时费力的工作,而且相当枯燥。人们必须找到更好的办法从根本上解决这个问题。

人们找到了另外一个办法,这就是虚拟内存管理(Virtual Memory Management)技术。虚拟内存管理技术的基本思想是程序,数据,堆栈的总的大小可以超过物理存储器的大小,操作系统把当前使用的部分保留在内存中,而把其他未被使用的部分保存在磁盘上。比如对一个16MB的程序和一个内存只有4MB的机器,OS通过选择,可以决定各个时刻将哪4M的内容保留在内存中,并在需要时在内存和磁盘间交换程序片段,这样就可以把这个16M的程序运行在一个只具有4M内存机器上了。而这个16M的程序在运行前不必由程序员进行分割。需要说明的一点,操作系统的内核是常驻内存的。

围绕着虚拟内存管理(Virtual Memory Management)技术,就产生了分页技术,虚拟地址,地址空间,TLB,MMU等概念

Tip: 成长路上必定经历很多风雨,加油吧,年轻人, 一起学习进步 ~

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

来杯清咖_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值