一、为什么有了GIL还要给线程加锁
先说一下GIL,所谓的GIL,也叫全局解释器锁,它限制了任何时候都只能有一个线程进入CPU进行计算,所以python所谓的多线程并不能真正的并行。
那为什么有了GIL还需要给线程加锁呢?不是直接一个线程处理完一个数据才轮到下一个线程进行吗?线程锁不是多此一举?
解决这个问题,我们得更深入到底层看看代码是怎么在CPU上运行的。在这里引入一个概念:原子操作
什么是原子操作
所谓的原子操作是指不会被线程调度机制打断的操作;这种操作一旦开始,就一直运行到结束,不会运行到一半,然后CPU切换到另外的线程。原子操作可以是一个步骤,也可以是多个操作步骤,但是其顺序不可以被打乱。
像 C语言的i++和python中的+=,-=,*=,/=都不是原子操作,他们在被翻译成机器指令时实际上是分三个步骤的,比如 i-=1 这个操作本质是这样的:
1、先把内存中的1存储在CPU的寄存器中
2、CPU进行计算,减一
3、将寄存器的内容写到内存中。
在1-3这个过程中,线程完全有可能被切换,所以可能导致线程数据的不安全。所以加锁是必要的。我们看看下面的一个例子。
from threading import Lock,Thread
n = 10000000
def func():
global n
for i in range(1000000):
n -= 1
t_lst = []
for i in range(10):
t = Thread(target=func)
t.start()
t_lst.append(t)
for i in t_lst:i.join()
print(n)
上面代码过程就是用十个线程去将一个数减到0,但是运行结果如下:
所以这就验证
了线程数据的不安全性。下面是加锁的版本
from threading import Lock,Thread
n = 10000000
def func(lock):
global n
for i in range(1000000):
lock.acquire()
n = n