目录
线程的概念
- 线程是一个进程的实体,一个进程可以拥有多个线程,一个线程必须有一个父进程。线程是由表示程序运行状态的寄存器(如程序计数器、栈指针)以及堆栈组成,它是比进程更小的单位;
- 线程是程序中的一个执行流。一个执行流是由CPU运行程序代码并操作程序的数据所形成的。因此,线程被认为是以CPU为主体的行为;
- 线程不包含进程地址空间中的代码和数据,线程是计算过程在某一时刻的状态。所以,系统在产生一个线程或各个线程之间切换时,负担要比进程小得多;
- 线程是一个用户级的实体,线程结构驻留在用户空间中,能够被普通的用户级函数直接访问;
- 一个线程本身不是程序,它必须运行于一个程序(进程)之中。因此,线程可以定义为一个程序中的单个执行流
多线程
是指一个程序中包含多个执行流,多线程是实现并发的一种有效手段。一个进程在其执行过程中,可以产生多个线程,形成多个执行流。每个执行流即每个线程也有它自身的产生、存在和消亡的过程;
多线程程序设计的含义就是可以将程序任务分成几个并行的子任务;
线程和进程的区别
- 进程是资源分配的最小单位,线程是程序执行的最小单位;
- 进程有自己的独立地址空间,每启动一个进程,系统就会为它分配地址空间,建立数据表来维护代码段、堆栈段和数据段,这种操作非常昂贵。而线程是共享进程中的数据的,使用相同的地址空间,因此CPU切换一个线程的花费远比进程要小很多,同时创建一个线程的开销也比进程要小很多;
- 线程之间的通信更方便,同一进程下的线程共享全局变量、静态变量等数据,而进程之间的通信需要以通信的方式(IPC)进行。不过如何处理好同步与互斥是编写多线程程序的难点;
- 多进程程序更健壮,多线程程序只要有一个线程死掉,整个进程也死掉了,而一个进程死掉并不会对另外一个进程造成影响,因为进程有自己独立的地址空间
线程的状态图
Python线程模块
⚫ _thread(低版本使用,不推荐)
⚫ threading
⚫ Multiprocessing
Python线程threading模块
threading模块提供的类:
Thread,Lock,Rlock,Condition,Semaphore,Event,Timer,local等。
threading模块提供的常用方法:
- threading.currentThread(): 返回当前的线程变量;
- threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程;
- threading.activeCount():返回正在运行的线程数量,与len(threading.enumerate())有相同的结果;
Thread类
Thread是threading模块中最重要的类之一,可以使用它来创建线程。