进程与线程:
进程:一个执行中的程序,每个进程都拥有自己的地址空间、内存、数据栈等。进程由操作系统统一管理。
线程:可以理解为在一个主进程中运行的迷你进程,共享相同的上下文。线程包括开始、执行顺序和结束三部分。它有一个指令指针用来记录当前执行的上下文,当其他线程运行时可以对其进行中断和挂起。
一个进程中的各个线程与主进程共享数据空间,所以比起独立的两个进程,线程间的信息共享与通信更加容易,也正是这样的数据共享机制让多任务间的协作成为可能。当然,在单核cpu中真正的并发是不可能实现的,所以单核cpu其实是在以循环的方式模拟并发处理。
python代码的执行是由python虚拟机(又名解释器主循环)进行控制的。对python来说,在主循环中同时只能有一个控制线程在执行,就像单核CUP中的多进程一样。内存中可以有很多程序,但在任意给定时刻只有一个线程会被解释器执行。对python虚拟机的访问是由全局解释器锁(GIL)控制的。这个锁用来保证同时只有一个线程在运行。在多线程环境中,python虚拟机将按照下面方式执行:
- 设置GIL
- 进入一个线程运行
- 执行下面的操作之一:
- 指定数量的字节码指令
- 线程主动让出控制权
- 切换出线程
- 解锁GIL
- 重复1~5
当调用外部代码(C/C++扩展的内置函数)时,GIL会保持锁定,直到函数执行结束。例如,对于任意调用了内置的C代码的面向I/O的python例程,GIL会在I/O调用前被释放,已允许其他线程在I/O执行的时候运行,而那些没有太多I/O操作的代码则倾向于在整个时间片内独占处理器与GIL,这意味着I/O密集型的python程序能够比计算密集型的程序更好地利用多线程环境。
python提供了包括thread、threading、Queue等模块来支持多线程编程,其中thread由于其局限性需要避免使用,threading是常用来进行线程管理的模块;使用Queue能够创建一个队列数据结构,在多线程之间进行共享。接下来对他们进行介绍:
Thread | 表示一个执行线程的对象 |
Lock | 锁原语对象 |
RLock | 可重入锁对象,使单一线程可以再次获得已经持有的锁(递归锁) |
Condition | 条件变量对象,使得一个线程等待另一个线程满足特定的条件,比如改变状态或某个数值 |
Event | 条件变量的通用版本,任意数量的线程等待某个事件发生,在该事件发生后所有线程将被激活 |
Semaphore | 为线程间共享的有限资源提供了一个“计数器”,在选定资源耗尽时阻塞 |
BoundedSemaphore | 与Semaphore类似,不过它不允许超过初始值 |
Timer | 与Thread相似,不过在运行前需要等待一段时间 |
Barrier | 创建一个“障碍”,需要线程达到指定数量后才可以冲破这个"障碍"继续执行 |
其中Thread是treading模块中的主要执行对象,下面是Thread对象的属性与方法:
Thread对象数据属性 | |
name | 线程名 |
ident | 线程的标识符 |
daemon | 一个布尔标志,表示这个线程是否是守护线程 |
Thread对象方法 | |
_init_(group=None, target=None,name=None, args=(),kwargs={},verbose=None,daemon=None) |
实例化一个线程对象,需要有一个可调用的target及其参数args或kwargs,还可以传递name或group参数,daemon的值将会设定thread.daemon标志。 |
start() | 开始执行线程 |
run() |