前言
Python语言的标准实现叫作CPython,它分两步来运行Python程序
- 步骤1:解析源代码文本,并将其编译成字节码(bytecode)
- 字节码是一种底层代码,可以把程序表示成8位的指令
- 从Python 3.6开始,这种底层代码实际上已经变成16位了
- 步骤2:CPython采用基于栈的解释器来运行字节码。
- 字节码解释器在执行Python程序的过程中,必须确保相关的状态不受干扰,
- CPython会用一种叫作全局解释器锁(global interpreter lock,GIL)的机制来实现运行的python程序的相关状态不受干扰
GIL
- GIL实际上就是一种互斥锁(mutual-exclusion lock,mutex),用来防止CPython的状态在抢占式的多线程环境(preemptive multithreading)之中受到干扰,因为在这种环境下,一条线程有可能突然打断另一条线程抢占程序的控制权。如果这种抢占行为来得不是时候,那么解释器的状态(例如为垃圾回收工作而设立的引用计数等)就会遭到破坏。
- CPython要通过GIL阻止这样的动作,以确保它自身以及它的那些C扩展模块能够正确地执行每一条字节码指令。
- GIL会产生一个很不好的影响。在C++与Java这样的语言里面,如果程序之中有多个线程能够分头执行任务,那么就可以把CPU的各个核心充分地利用起来。尽管Python也支持多线程,但这些线程受GIL约束,所以每次或许只能有一条线程向前推进,而无法实现多头并进。
- 所以,想通过多线程做并行计算或是给程序提速的开发者,恐怕要失望了。
- 并发 concurrency : 指计算机似乎能在同一时刻做许多不同的事情
- 并行 parallelism : 指计算机确实能够在同一时刻做许多不同的事情
多线程下的线程执行
- 获取GIL
- 执行代码直到sleep或者是 python虚拟机将其挂起。
- 释放 GIL
多线程效率低于单线程原因
- 如上我们可以知道,在 python中想要某个线程要执行必须先拿到 GIL这把锁,且 python只有一个 GIL,拿到这个 GIL才能进入 CPU执行, 在遇到 I/O操作时会释放这把锁。如果是纯计算的程序,没有 I/O 操作,解释器会每隔 100次操作就释放这把锁,让别的线程有机会 执行(这个次数可以通sys.setcheckinterval来调整)。所以虽然 CPython 的线程库直接封装操作系统的原生线程,但 CPython 进程做为一个整体,同一时间只会有一个获得了 GIL 的线程在跑,其它的线程都处于等待状态等着 GIL 的释放。
- 而每次释放 GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于 GIL锁存在,python里一个进程永远只能同时执行一个线程 (拿到 GIL的线程才能执行 ),这就是为什么在多核 CPU上, python的多线程效率并不高
多线程效率低于或高于单线程原因
- 相同的代码,为何有时候多线程会比单线程慢,有时又会比单线程快? 这主要跟运行的代码有关:
- CPU密集型代码(各种循环处理、计数等等 ),在这种情况下,由于计算工作多, ticks计数很快就会达到 100阈值,然后触发 GIL的释放与再竞争 (多个线程来回切换当然是需要消耗资源的),所以 python下的多线程遇到 CPU密集型代码时,单线程比多线程效率高。
- IO密集型代码 (文件处理、网络爬虫等 ),多线程能够有效提升效率单线程下有 IO操作会进行 IO等待,造成不必要的时间浪费。开启多线程能在线程 A等待时,自动切换到线程 B,可以不浪费 CPU的资源,从而能提升程序执行效率 。进行IO密集型的时候可以进行分时切换 所有这个时候多线程快过单线程
如果 python想充分利用多核 CPU,可以采用多进程
- 每个进程有各自独立的 GIL,互不干扰,这样就可以真正意义上的并行执行。
在 python中,多进程的执行效率优于多线程 (仅仅针对多核 CPU而言 )。所以在多核 CPU下,想做并行提升效率,比较通用的方法是使用多进程,能够有效提高执行效率
代码示例:
# 多线程
# 最后完成的线程的耗时
# [TIME MEASURE] execute function: gene_1000_field took 3840.604ms
@time_measure
def mult_thread(rows):
# 总行数
rows = rows
# 线程数
batch_size = 4
cell = math.ceil(rows / batch_size)
# 处理数据生成
print('数据生成中,线程数:' + str(batch_size))
threads = []
for i in range(batch_size):
starts = i * cell
ends = (i + 1) * cell
file = f"my_data_{str(i)}.csv"
# t = threading.Thread(target=gene_1000_field_test, args=(starts, ends, file))
t = threading.Thread(target=gene_1000_field, args=(starts, ends, file))
t.start()
threads.append(t)
# for t in threads:
# t.join()
# 多进程
# [TIME MEASURE] execute function: gene_1000_field took 1094.776ms
# 执行时间和单个线程的执行时间差不多,目的达到
@time_measure
def mult_process(rows):
# 总行数
rows = rows
# 线程数
batch_size = 4
cell = math.ceil(rows / batch_size)
# 处理数据生成
print('数据生成中,线程数:' + str(batch_size))
process = []
for i in range(batch_size):
starts = i * cell
ends = (i + 1) * cell
file = f"my_data_{str(i)}.csv"
# p = Process(target=f, args=('bob',))
# p.start()
# p_lst.append(p)
# t = threading.Thread(target=gene_1000_field_test, args=(starts, ends, file))
p = Process(target=gene_1000_field, args=(starts, ends, file))
p.start()
process.append(p)
参考文章:
- https://www.cnblogs.com/caopeiyang/p/9418897.html
- https://www.cnblogs.com/nickchen121/p/11130256.html