解决QEMU无法从非0x80000000处开始执行

1 背景介绍

在使用NEMU与QEMU做DiffTest的场景下,运行的固件为《RISC-V体系结构编程与实践》中示例代码chapter_2,编译出来的固件二进制文件为:benos_payload.bin

将benos_payload.bin,放置在NEMU中内存0x80000000处,NEMU通过Socket发送放置到QEMU中内存0x31e00000处。

计划让QEMU直接从0x31e00000开始执行,而不是常规的0x80000000。

对NEMU源码,做了如下修改。将nemu/src/cpu/difftest/dut.c文件,init_difftest函数,修改为如下:

void init_difftest(char *ref_so_file, long img_size, int port) {
    ...
    ref_difftest_init(port);
    
    // 将benos_payload.bin发送到QEMU的0x31e00000内存处
    ref_difftest_memcpy(0x31e00000, guest_to_host(RESET_VECTOR), img_size, DIFFTEST_TO_REF);
    // pc寄存器设置为0x31e00000
    cpu.pc = 0x31e00000;
    // 将NEMU的x0 ~ x31和pc寄存器值,发送到QEMU中,覆盖QEMU原有寄存器
    ref_difftest_regcpy(&cpu, DIFFTEST_TO_REF);
    // 让QEMU执行3000条指令
    ref_difftest_exec(3000);
}

只要NEMU执行了上述代码,那么QEMU的0x31e00000处保存的就是benos_payload.bin,并且pc寄存器值为0x31e00000,当执行ref_difftest_exec函数时,预期QEMU就可以从0x31e00000开始执行。

2 问题描述

QEMU无法从0x31e00000开始执行,甚至一条指令都取不出来(qemu-7.1.0/target/riscv/translate.c中decode_opc函数第1052行,不会中断停下来)。

3 原因分析

我们调试QEMU源码,发现NEMU通过Socket发给QEMU的二进制镜像,并没有被写入QEMU的0x31e00000内存中,而是跳过了。
这点找一个正常向0x80000000写入成功的例子,来对照一下,就很容易定位。
因此,内存中没有该二进制可执行内容,故无法取指执行。

4 解决办法

在qemu-7.1.0/hw/riscv/spike.c文件,spike_board_init函数中,有如下调用:

/* register system main memory (actual RAM) */
memory_region_add_subregion(system_memory, memmap[SPIKE_DRAM].base, machine->ram);

注册系统主内存时,默认使用spike.c文件中spike_memmap数组,第SPIKE_DRAM个元素,该数组定义如下:

static const MemMapEntry spike_memmap[] = {
    [SPIKE_MROM] =     {     0x1000,     0xf000 },
    [SPIKE_HTIF] =     {  0x1000000,     0x1000 },
    [SPIKE_CLINT] =    {  0x2000000,    0x10000 },
    [SPIKE_DRAM] =     { 0x80000000,        0x0 },
};

因此,QEMU只认为0x80000000开始为DRAM,其他不认。
我们只需要,将0x80000000修改为0x30000000,再次尝试从0x31e00000运行,就成功了。

5 踩坑回忆

5.1 坑1 - 怀疑设备树有问题

当时第一反应,是以为设备树不对,因此修改了设备树中memory地址定义。事实证明没用。

后面看了QEMU的spike_board_init函数代码,其实QEMU会默认创建一个设备树,该设备树中memory地址,默认使用的是spike_memmap数组,因此我们只要改了spike_memmap数组,那设备树中memory地址也会改变。

以下,附一些设备树的常用命令。

从QEMU中导出设备树,启动QEMU时,添加如下选项:

-M virt,dumpdtb=123.dtb 

将DTS编译为DTB:

dtc -I dts -O dtb -o 123.dtb 123.dts

将DTB转为DTS:

dtc -I dtb -O dts 123.dtb -o 123.dts

5.2 坑2 - 怀疑QEMU中内存未写入成功

真实原因就是这个。
其实在qemu-7.1.0/gdbstub.c中有一对函数:

  • handle_write_mem函数
  • handle_read_mem函数

NEMU发送数据给QEMU时,会调用handle_write_mem,如果在NEMU中再实现一个读内存的发包函数,那么就可以从QEMU中读取内存,在NEMU中将读到的数据与之前写入的数据,进行比较,很容易定位,两次数据不一致,内存写入有问题。

附,写内存数据包格式

// 写入内存,数据包
"M0x31e00000,5dc:1711000013010100b7120000330151006f00001e1301..."
  • M表示写入内存,m表示读取内存。
  • 0x31e00000:表示写入内存的地址为0x31e00000。
  • 0x5dc:表示后面跟的,数据长度为1500字节,实际数据包中因为是2个字符表示一个字节,因此后面实际字符串数据长度为1500*2。
  • 1711000013010…:表示数据,"171100"解析后,就是0x17 0x11 0x00,低字节在前,高字节在后。

5.3 QEMU地址空间分析过程

以下内容很乱,请忽略,纯记录。

QEMU中有一个结构GDBState,包含了很多信息,就包含CPU的地址空间。
该结构中有个成员g_cpu,层次关系如下:

// 是否为DRAM地址
g_cpu->cpu_ases[0].as->current_map->dispatch->mru_section->mr->ram
// DRAM基址
g_cpu->cpu_ases[0].as->current_map->dispatch->mru_section->offset_within_address_space
// DRAM空间大小
g_cpu->cpu_ases[0].as->current_map->dispatch->mru_section->size

MemoryRegionSection表示一个地址范围,如[0x80000000, 0x88000000]。
其offset_within_address_space表示基址,size表示大小。

typedef QTAILQ_HEAD(CPUTailQ, CPUState) CPUTailQ;
// 展开后为:
typedef union CPUTailQ {
    struct CPUState* tqh_first;    // first element
    QTailQLink tqh_circ;       // last element
} CPUTailQ;

extern CPUTailQ cpus;
CPUState* cpu = first_cpu = (&cpus)->tqh_first

打的一些断点:

  • b gdbstub.c:836,gdbstub.c中gdb_first_attached_cpu()
  • b cpus-common.c:92
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

百里杨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值