Python多线程与GIL
GIL(Global Interpreter Lock)是在实现Python解析器(CPython)时所引入的一个概念。但值得注意的是,GIL并不一定是所有Python编译器均必须的,如JPython就没有GIL。
GIL是Python为解决多线程之间数据完整性和状态同步的办法,类似于在存在一个全局的锁,但是在现在看来已经成为了一个Python的缺陷。
GIL的影响
一般来说,多线程的并行执行要比单线程的串行执行的速度要快,但是在Python中却不一定。下面给出单线程串行代码和多线程的代码,有兴趣的读者可以自己尝试运行,会发现串行的代码执行速度更快,这就是GIL给以CPython为解析器的Python带来的缺陷。
单线程代码:
#! /usr/bin/python
from threading import Thread
import time
global count
count = 0
def my_counter():
global count
i = 0
for _ in range(1000000):
count += 1
i = i + 1
return True
def main():
thread_array = {}
start_time = time.time()
for tid in range(2):
t = Thread(target=my_counter)
t.start()
t.join()
end_time = time.time()
print("Total time: {}".format(end_time - start_time))
print ("Count: ", count)
if __name__ == '__main__':
main()
多线程代码:
#! /usr/bin/python
from threading import Thread
import time
global count
count = 0
def my_counter():
global count
i = 0
for _ in range(1000000):
i = i + 1
count += 1
return True
def main():
thread_array = {}
start_time = time.time()
for tid in range(2):
t = Thread(target=my_counter)
t.start()
thread_array[tid] = t
for i in range(2):
thread_array[i].join()
end_time = time.time()
print("Total time: {}".format(end_time - start_time))
print("Count:", count)
if __name__ == '__main__':
main()
但是,Python的多线程执行的结果与多线程是类似的,上例中由于全局变量count并没有加锁,因此在多线程执行的结果与单线程的执行结果不一致,因此我们不能依靠GIL来为我们提供了线程共享资源的安全访问。
建议
在Python中尽量使用multiprocessing库替代thread库,虽然多进程的资源共享没有多线程方便,但是此时运行的效果与您想的一致,不会出现让你觉得很怪异的问题。