进程
进程是系统进行资源分配和调度的基本单位,是操作系统结构的基础。
在当代面向线程设计的计算机结构中,进程是线程的容器。
程序是指令、数据及其组织形式的描述,进程是程序的实体。
进程是一个具有独立功能的程序关于某个数据集合的一次运行活动。它可以申请和拥有系统资源,是一个动态概念,是一个活动的实体。它不只是程序的代码,还包括当前的活动。通过程序计数器的值和处理寄存器的内容来表示。
两点概念
1、进程是一个实体,每一个进程都有它自己的地址空间,一般情况下,包括文本区域、数据区域和堆栈。文本区域存储处理器执行的代码;数据区域存储变量和进程执行期间使用的动态分配的内存;堆栈区域存储着活动过程调用的指令和本地变量。
2、进程是一个“执行中的程序”,只有操作系统执行程序,程序才能成为一个实体,我们称之为进程。
线程和多线程
也被称为轻量级进程,是程序执行流的最小单元。
线程是进程的一个实体,是被系统独立调度和分派的基本单位。线程自己不拥有系统资源,但它可与同属于一个进程的其他线程共享进程所拥有的全部资源。
在单个程序中同时运行多个线程完成不同的工作,称为多线程。
GIL锁
也称为全局解释器锁。
线程的特点是数据资源是共享的,而多个线程又要共享Cpython(python解释器)解释权限,共享意味着竞争,然后竞争的话数据就会不安全,并且要保证同一时刻只有一个线程执行代码,每个线程在执行过程中都要先获取GIL。
下面是线程中的生产者消费者模型
from queue import Queue
import time
import threading
#生产者消费者模式是线程间通信的一种应用
#在使用数据结构的时候确定是否是线程安全,Queue本身是线程安全的
#list([]) Dict({}) 都不是线程安全的
def set_value(q):
index = 0
while True:
q.put(index)
index += 1
q.put(index)
index += 1
time.sleep(2)
def get_value(q):
while True:
print("消费者获取数据",q.get()) #如果队列为空,get()方法会sleep,直到队列有数据
def main():
q = Queue(8)
t1 = threading.Thread(target=set_value,args=[q])
t2 = threading.Thread(target=get_value,args=[q])
t1.start()
t2.start()
if __name__ == '__main__':
main()
协程
协程是一种用户态的轻量级线程,协程的调度完全由用户控制。
下面是协程的生产者消费者模型
from queue import Queue
import time
import threading
#生产者消费者模式是线程间通信的一种应用
#在使用数据结构的时候确定是否是线程安全,Queue本身是线程安全的
#list([]) Dict({}) 都不是线程安全的
def set_value(q):
index = 0
while True:
q.put(index)
index += 1
q.put(index)
index += 1
time.sleep(2)
def get_value(q):
while True:
print("消费者获取数据",q.get()) #如果队列为空,get()方法会sleep,直到队列有数据
def main():
q = Queue(8)
t1 = threading.Thread(target=set_value,args=[q])
t2 = threading.Thread(target=get_value,args=[q])
t1.start()
t2.start()
if __name__ == '__main__':
main()
三者区别
1、先有进程,然后进程可以创建线程,线程是依附在进程里面的,线程里面可以包含多个协程。
2、进程之间不共享全局变量,线程之间共享全局变量,但是要注意资源竞争问题。两者都不共享局部变量。
3、多进程开发比单进程,多线程开发稳定性要强,但是多进程开发比多线程开发资源开销要大。
4、多线程开发,线程之间执行是无序的,协程之间按照一定顺序交替执行。
5、协程主要用在网络爬虫和网络请求,开辟一个协程大概需要5k空间,开辟一个线程需要512k空间,开辟进程占用资源最多。
6、一个线程可以有多个协程,一个进程也可以单独拥有多个协程,这样python中则能够使用多核CPU。