目前Qemu 1.3.0的线程模型是这个样子的:
- 每个vcpu是一个单独的thread; vcpu thread在VM_ENTER以后执行客户机代码, 在VM_EXIT以后根据退出原因执行PIO或者MMIO。
- 一个独立的io线程,主要用来处理:
- 轮询IO,包括定时信号 (alarm signalfd), AIO (eventfd), 并执行事件对应的回调函数(poll, read, write)
- 调度并执行BH (Bottom Half)
- 运行所有时钟的定时器 (vm_clock, rt_clock, host_clock)
- 极少可以被独立执行的任务被放在独立的线程中运行,比如VNC和SPICE。
- IO Thread和vCPU Threads使用一个全局线程锁(qemu_global_mutex)来进行同步。
使用一个独立的线程来处理IO的优点是实现简单,不用考虑多线程环境中复杂的同步问题;但是缺点是IO延迟较大,吞吐量也收到影响,kvm官网上有一篇paper专门分析了目前QEMU IO stack导致的延迟,和裸设备相比,大概会增加35%左右:
目前,qemu的主干版本也在考虑改进io thread, 比如dataplane。 它使用一个单脱离qemu上下文的thread,利用epoll来处理io, 从而大幅的提高qemu io性能,但是因为完全dataplane线程完全脱离qemu上下文,所以也无法识别虚拟镜像格式,目前只能支持raw格式。
https://lists.nongnu.org/archive/html/qemu-devel/2013-01/msg00088.html