创建线程基本用法
# 线程必须存在于进程,是执行任务的最小单元,基本用法跟进程一致
from threading import Thread
import time
def get_urls(url):
time.sleep(2)
print("这是一个线程",url)
if __name__ == '__main__':
t =Thread(target=get_urls,args=('www.1.com',)) #创建一个线程
t.start()
创建多线程
from threading import Thread
import time
def get_urls(url):
time.sleep(2)
print("这是一个线程",url)
if __name__ == '__main__':
start = time.time()
list = ['www.1.com','www.2.com','www.3.com']
for i in list:
t =Thread(target=get_urls,args=(i,))
t.start()
处理完线程再结束主进程
from threading import Thread
import time
def get_urls(url):
time.sleep(2)
print("这是一个线程",url)
if __name__ == '__main__':
start = time.time()
th_list = []
list = ['www.1.com','www.2.com','www.3.com']
for i in list:
t =Thread(target=get_urls,args=(i,)) #创建一个线程
t.start()
th_list.append(t)
for i in th_list:
i.join() # 等所有线程结束后才结束进程
print('总耗时:',time.time()-start)
返回结果:
这是一个线程www.1.com
这是一个线程www.3.com
这是一个线程www.2.com
总耗时: 2.0380520820617676
总结:由于python存在GIL锁的缘故,python是无法使用多进程并发的,考虑到进程之间数据不能共享,为了避免数据读写错乱,这个GIL锁的作用简单理解成每个进程内的线程之间都需要等待上个进程的线程结束才可以执行下一个进程的线程,具体使用中使用多进程还是多线程根据实际选择。
线程:IO密集运算的程序,如爬虫,会使用大量读写文件
进程:运算密集的程序,如一些算法。