qemu-dyngen动态翻译技术

由于刚刚接触qemu,所以前面几篇文章仅仅是肤浅的介绍qemu的一些背景知识,今天突然感觉前面说的太没有条理了,而且大部分是读别人的文章,一知半解,没有自己的总结体会,今天感觉稍微有点心得,敬请指教。

1. 明确guest和host

对于qemu而言,被仿真的平台成为guest或者说target;很明显,运行qemu的平台就称为host。

2. 了解qemu动态翻译技术的发展

qemu运用动态翻译的技术将guest binary instructions动态翻译成host binary instructions,之后由host运行翻译后的指令。在qemu-0.9之前的版本都采用dyngen的动态翻译技术,而从qemu-0.10开始的版本开始采用TCG(Tiny Code Generator)的翻译技术。

采用dyngen 动态翻译技术的资料主要有以下两篇文章,是了解动态翻译技术入门的好文章(在后续的分析中,会简单介绍dyngen技术):

  • QEMU, a Fast and Portable Dynamic Translator
  • Porting QEMU to Plan 9: QEMU Internals and Port Strategy

介绍TCG技术的文章则相对较少,主要是阅读qemu源码和qemu官网上的相关资料。

3. dyngen简单介绍

图1简单说明了qemu采用dyngen动态翻译技术将目标平台指令翻译成主机平台指令的简单过程。



假设target为PowerPC,host为x86,说明整个翻译过程:

dyngen在整个过程中扮演了非常重要的角色,其详细功能在这里不再详述,但是有一个疑问,希望与大家讨论:
在将目标平台指令集向micro-operations这一步的转化中,《QEMU, a Fast and Portable Dynamic Translator》一文中提到采用了hand coded code的方式,我理解是我们说的“硬编码”,即目标平台指令到micro-op是预先写好的一一映射的关系,我的疑问就是这种一一映射的关系是怎么实现的,因为没有看过qemu-0.9之前版本的代码,所以很想知道是怎么hand coded 的。另外,该文还提到“When QEMU first encounters a piece of target code, it translates it to host code ... ....”, 我的问题是qemu怎么处理目标平台的objective file的, 比方说qemu怎么分析一个ELF文件,怎么从中读取指令,怎么来进行后面的hand coded ????
在dyngen动态翻译技术中,还涉及到几个比较重要的地方,比如:
(1)TBs,Translated Blocks
qemu将TB定义为碰到下一个jump指令或修改CPU state的指令之前的所有代码称为一个TB
(2)寄存器分配
target平台的寄存器被映射到host的固定寄存器或指定的内存地址
(3)条件代码的优化
(4)TB块以hash表的形式组织
(5)mmap()系统调用仿真target的MMU
(6)longjmp()实现异常仿真
(7)异步轮询的方式实现中断的仿真
至于 (3)~(7)的具体实现方式,现在还比较模糊,希望与大家交流!!!!!!!!!

4. TCG简单介绍

TCG是qemu的核心,主要实现了以下翻译流程:

guest binary instructions -> TCG IR -> host binary instructions TCG 定义了一组IR(intermediate representation),这些IR大致可以分为以下几类:

- Mov类操作: mov, movi, ... - 逻辑操作: and, or, xor, shl, shr, ... - 算术操作: add, sub, mul, div, ... - 分支跳转操作: jmp, br, brcond - 函数调用: call - 内存操作: ld, st - QEMU的特殊操作: tb_exit, goto_tb, qemu_ld/qemu_st
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值