python虚拟机基于寄存器_基于栈的虚拟机VS基于寄存器的虚拟机

最新推荐文章于 2022-05-12 22:28:10 发布

神康不是狗

最新推荐文章于 2022-05-12 22:28:10 发布

阅读量233

点赞数 1

文章标签： python虚拟机基于寄存器

本文链接：https://blog.csdn.net/weixin_35735685/article/details/113676725

版权

什么是虚拟机

虚拟机是借助于操作系统对物理机器的一种模拟。但是我们今天所讲述的虚拟机概念比较狭义，与vmware或者virtual-box不同，而是针对具体语言所实现的虚拟机。例如在JVM或者CPython中，JAVA或者python源码会被编译成相关字节码，然后在对应虚拟机上运行，JVM或CPython会对这些字节码进行取指令，译码，执行，结果回写等操作，这些步骤和真实物理机器上的概念都很相似。相对应的二进制指令是在物理机器上运行，物理机器从内存中取指令，通过总线传输到CPU，然后译码、执行、结果存储。

与虚拟机实现相关的概念如下：

将源码编译成VM指定的字节码。

包含指令和操作数的数据结构(指令用于处理操作数作何种运算)。

一个为所有函数操作的调用栈。

一个“指令指针(Instruction Point ---IP)”：用于指向下一条将要执行的指令。

一个虚拟的“CPU”--指令的派发者:

取指：获取下一条指令(通过IP获取)

对指令进行翻译，将要作何种操作。

执行指令。

以上是CPU的三级流水线操作，实际上五级流水线还包括回写，即把执行后生成的结果回写进存储器。

虚拟机的实现方式

有两种基本的方法实现虚拟机：基于Stack的和基于Register的，比如基于Stack的虚拟机有JVM、.net的CLR，这种基于Stack实现虚拟机是一种广泛的实现方法。而基于Register的虚拟机有Lua VM(是Lua编程语言的虚拟机)和Dalvik VM。这两种虚拟机实现的不同主要在于操作数和结果的存储和检索机制不一样。

基于栈的虚拟机

基于栈的虚拟机有一个操作数栈的概念，虚拟机在进行真正的运算时都是直接与操作数栈(operand stack)进行交互，这样做的直接好处就是虚拟机可以无视具体的物理架构，但缺点也显而易见，就是速度慢，因为无论什么操作都要通过操作数栈这一结构(不过值得一提的是实现时通过栈顶缓存(top-of-stack caching)可以大幅降低基于栈的解释器的数据移动开销，可以让这部分开销跟基于寄存器的在同等水平)。

由于执行时默认都是从操作数栈上取数据，那么就无需指定操作数。这就相当于所有操作数的存储位置都是运行期决定的，在编译器的代码生成阶段不需要额外为在哪里存储操作数费心，所以基于栈的编译器实现起来相对比较简单直接。也正因为这个原因，每条指令占用的存储空间也比较小(无需带地址)。

但是，对于一个简单的运算，基于栈的虚拟机会使用过多的指令组合来完成(例如简单的加法，因为默认操作数存放在操作数栈上，需要从操作数栈上pop出两条数据直接执行加法运算，运算后的结果需要存放在栈顶)，这样就增加了整体指令集合的长度。vm会使用同样多的迭代次数来执行这些指令，这对于效率来说会有很大的影响。并且，由于操作数都要放到stack上面，使得移动这些操作数的内存复制大大增加，这也会影响到效率。例如执行"a = b + c"，在基于栈的虚拟机上字节码指令如下所示：

I1: LOAD C

I2: LOAD B

I3: ADD

I4: STORE A

基于寄存器的虚拟机

基于寄存器的虚拟机中没有操作数栈的概念，但是有很多虚拟寄存器，这些“寄存器”跟CPU中的寄存器没有任何关联，其实和操作数栈相同，这些寄存器也存放在运行时栈中，本质上就是一个数组。“寄存器”的数据在运算的时候，直接送入物理CPU进行计算，无需再传送到operand stack上然后再进行运算。

基于寄存器的虚拟机没有基于栈的虚拟机在拷贝数据而使用的大量的出入栈(push/pop)指令。同时指令更紧凑更简洁。但是执行的指令就需要包含操作数的地址，也就是说，指令必须明确的包含操作数的地址，这不像栈可以用栈指针去操作，所以基于寄存器的代码会比基于栈的代码要大，但是由于指令数量的减少，其实没有大多少。不过，在编译器设计上，就要在代码生成阶段对寄存器进行分配，增加了实现的复杂度。

基于寄存器得虚拟机还有一个优点就是一些在基于Stack的虚拟机中无法实现的优化，比如，在代码中有一些相同的减法表达式，那么寄存器只需要计算一次，然后将结果保存，如果之后还有这种表达式需要计算就直接返回结果。这样就减少了重复计算所造成的开销。

Lua VM

Lua在运行代码之前，会先把源码预编译成一种内部编码，这种编码由一连串的虚拟机能够识别的指令构成，与CPU的机器码很相似。接下来由C代码中的一个while循环负责解释这些内部编码，这个while循环中有一个很大的switch，一种指令就有对应的一个case。

自5.0版本开始，Lua就使用一个基于寄存器的虚拟机。但是这些“寄存器”跟CPU中的寄存器没有任何关联，因为这种关联会使Lua失去可移植性，并且会使Lua受限于可用的寄存器数量。Lua使用一个栈(由一个数组加上一些索引实现)来存放它的寄存器。每一个运行中的函数都有各自的一份活动记录，这些活动记录保存在栈中，内部存放着每个函数对应的寄存器。所以每个函数都有一组各自的寄存器。每条指令中只有8个bit用来标志寄存器，所以每个函数最多能够使用250个寄存器。

由于Lua有如此大量的寄存器，所以在预编译时能够将所有的局部变量存放到寄存器中。所以，在Lua中，访问局部变量是很快的。