代码验证多进程,多线程对cpu的使用情况
#多线程
import threading
#子线程死循环
def test():
while True:
pass
t1 = threading.Thread(target=test)
t1.start()
#主线程死循环
while True:
pass
#多进程
import multiprocessing
def deadLoop():
while True:
pass
#子进程死循环
p1 = multiprocessing.Process(target=deadLoop)
p1.start()
#主进程死循环
deadLoop()
通过代码可以发现 多进程可以充分使用cpu的两个内核 而多线程却不能充分使用cpu的两个内核
问题 : 通过验证我们发现多线程并不能真正的让多核cpu实现并行
原因 : cpython解释器中存在一个GIL(全局解释器锁),他的作用就是保证同一时刻只有一个线程可以执行代码,因此造成了我们使用多线程的时候无法实现并行
解决方案法 :
1:更换解释器 比如使用jpython(java实现的python解释器)
2:使用多进程完成多任务的处理
- Python语言和GIL没有半毛钱关系。仅仅是由于历史原因在Cpython虚拟机(解释器),难以移除GIL。
- GIL:全局解释器锁。每个线程在执行的过程都需要先获取GIL,保证同一时刻只有一个线程可以执行代码。
- 线程释放GIL锁的情况: 在IO操作等可能会引起阻塞的system call之前,可以暂时释放GIL,但在执行完毕后,必须重新获取GIL Python 3.x使用计时器(执行时间达到阈值后,当前线程释放GIL)或Python 2.x,tickets计数达到100
- Python使用多进程是可以利用多核的CPU资源的。
- 多线程爬取比单线程性能有提升,因为遇到IO阻塞会自动释放GIL锁