关闭

浅析Python虚拟机执行框架

标签: python原理
286人阅读 评论(0) 收藏 举报
分类:

浅析Python虚拟机执行框架

2010-02-24 10:39 佚名 CSDN 字号:T | T
一键收藏,随时查看,分享好友!

下面的文章大家即将看到Python虚拟机的整体执行框架,大家还可以看到Python虚拟机在执行过程中不断使用的执行环境。

AD:

在Python虚拟机中一个最核心的概念,在Python语言中,一切都是对象,也就是说一个整数就是一个对象,一个字符串也是一个对象,其实类型也是一种对象,整数类型是一个对象。

了解这两点对掌握第二部分的内容已经足够了。但是,虚拟机和执行环境还仅仅是Python运行机理(或者说运行模型)的一部分,为了对Python整个的运行机理做一个全面的了解,我们还需要大致了解一下Python的运行时环境。

前面我们说了,PyFrameObject对应于可执行文件在执行时的栈帧,但是一个可执行文件要在操作系统中运行,只有栈帧是不够的。之前我们遗漏了两个对于可执行文件运行至关重要的概念:进程和线程。

在本节中,我们首先要对Python的运行模型(主要是线程模型)进行一个整体概念上的了解,虽然这部分内容我们会留到剖析Python的多线程实现时再详细考察。但是由于Python虚拟机在初始化时会创建一个主线程。

所以其运行时环境中存在一个主线程,而且本部分将剖析的Python的异常机制会利用到Python内部的线程模型,因此对Python线程模型有一个整体概念上的了解也是必须的。以Win32平台为例,我们知道,对于原生的Win32可执行文件,无论是由C/C++产生,还是由Delphi产生,都会在一个进程(Process)中运行。

进程并非是与机器指令序列相对应的活动对象,这个与可执行文件中机器指令序列对应的活动对象是由线程(Thread)这个概念来进行抽象的,而进程则是线程的活动环境。对于通常的单线程可执行文件,在执行时操作系统会创建一个进程,在进程中,又会有一个主线程;而对于多线程的可执行文件,在执行时会操作系统会创建一个进程和多个线程。

该多个线程能共享进程地址空间中的全局变量,这就自然而然地引出了线程同步的问题。CPU对任务的切换实际上是在线程之间切换,在切换任务时,CPU需要执行线程环境的保存工作,而在切换至新的线程之后,需要恢复该线程的线程环境。

这些关于程序运行的概念同样适用于PythonPython实现了对多线程的支持,而且Python中的一个线程就是操作系统上的一个原生线程。这里我们对多线程机制不过多深入,现在只需记住,Python在执行时,可能会有多个线程存在。

在前面我们看到了虚拟机的大致运行框架,实际上这个虚拟机就是Python中对CPU的抽象,可以看做是一个软CPU,Python中的所有线程都使用这个软CPU来完成计算工作。真实机器上的任务切换机制对应到Python中。

就是使不同的线程轮流使用虚拟机的机制。CPU切换任务时需要保存线程运行环境。对于Python来说,在切换线程之前,同样需要保存关于当前线程的信息。在Python中,这个关于线程状态信息的抽象是通过PyThreadState对象来实现的,一个线程将拥有一个PyThreadState对象。

所以从另一种意义来说,这个PyThreadState对象也可以看成是对线程本身的抽象。但实际上,这两者是有很大区别的,PyThreadState并非是对线程本身的模拟,因为Python中的线程仍然使用操作系统的原生线程。

PyThreadState仅仅是对线程状态的抽象,不过在本书的大部分章节中,为了叙述的方便,我们不过分严格地区分线程和线程状态本身。所以在以后我们有时会称PyThreadState为线程对象,有时会称之为线程状态对象。只有在剖析多线程机制时,我们会严格区分两者。对于下面将提到的PyInterpreterState对象,也有类似的考量。

刚才提到,在Win32下,线程是不能独立存活的,它需要存活在进程的环境中,而多个线程可以共享进程的一些资源。在Python中同样也是如此,考虑一下,如果Python程序中有两个线程,都会进行同样的一个动作——import sys,那么这个sys module究竟应该存在几份?

是全局共享的还是每个线程都有一个sys module?如果每个线程有自己独立module集合,那么Python对内存的消耗就会显得非常惊人。所以在Python中,这些module都是全局共享的,仿佛这些module都是进程中的共享资源一样,对于进程这个抽象概念,Python以PyInterpreterState对象来实现。

在Win32下,通常都会有多个进程,而Python实际上也可以有多个逻辑上的interpreter存在。在通常的情况下,Python中只有一个interpreter。这个interpreter中维护了一个或多个PyThreadState对象,与这些PyThreadState对象对应的线程轮流使用一个字节码执行引擎。看,是不是与真实机器上的程序执行模型非常相似?

谈到多线程,就不能不谈到线程同步。在Python虚拟机中,是通过一个全局解释器锁GIL(Global Interpreter Lock)来实现线程同步的,关于这部分内容,我们留到剖析Python多线程机制时再详细考察。

好了,现在讨论刚才提到的那两个关键对象:表示进程概念的PyInterpreterObject对象和表示线程概念的PyThreadState对象。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:17377次
    • 积分:245
    • 等级:
    • 排名:千里之外
    • 原创:0篇
    • 转载:43篇
    • 译文:0篇
    • 评论:0条
    文章分类