VFIO的msix bar空间不是向用户态透传的,而是GUEST退出到KVM/QEMU里处理的。原因也比较容易理解,就是虚机里的MSIX中断需要QEMU和KVM的复杂处理,所以必须退出到主机。
一、硬件架构原理
首先虚机透传设备,中断实现完全依赖于CPU架构支持。
1)最开始的VT-x,接收到中断后VCPU会退出到宿主机,宿主机的中断处理流程会触发写入VMCS的中断配置区域,等到中断处理完成回到GUEST模式时,VCPU因为VMCS里的中断配置会立即响应中断,进而实现虚机里的中断转发。
2)优化后的VT-x,接收到中断后在宿主机处理,宿主机的中断处理流程会写入VMCS里的virtual-apic,VCPU响应中断。这与1)的区别在于不需要VCPU专门退出响应这个中断了,可以由工作在宿主机模式的CPU处理中断,然后给相应虚机的VCPU注入中断。VCPU在GUEST模式运行期间就可以响应中断了。这称为APIC-V机制。
要知道一次VM-exit的性能损耗是很大的,这大大减少VM-exit的次数。而且也能提高虚机中断的实时响应。
3)VT-d的Post interrupt。作为所有设备访问的通道,IOMMU里的中断重定向表可直接将中断的memory write翻译成2)中VMCS区域的中断向量表访问。不需要软件的中断处理流程来实现了,硬件直接翻译实现,大大提高性能和实时性。
维护上需要考虑一些点,如果VCPU切换硬件CPU运行,VMCS是跟着硬件CPU走的,相应的中断重定向表是不是需要更新。另外如果VCPU在exit到主机期间有中断发生,此时IOMMU会如何处理?
二、QEMU/KVM中断实现
VFIO的bar空间正常都是透传的形式