提到Python的多线程,大家都说鸡肋。至于为什么,一定又要说什么“GIL的全称是Global Interpreter Lock(全局解释器锁)”之类的解释了,哥书读的少,听不太懂,反正能让我们这种村里人看到同时跑了几个就行,至于什么多线程多进程,CPU是并行还是并发的,都随他去吧。
今天主要说一下threading模块的进程锁与进程管理内容。
用threading有几次,都是简单的有两个或者三个任务需要并发执行,比如服务器的主备等等,不用管它锁不锁的。但这次想用于管理几百个任务的依次并发,不得不看看了。
先说下threading.lock()
由于存在多个进程共同去修改某个数据的问题,所以必须要用到lock()
这东西比较简单,lock.acquire()用于添加锁,lock.release() 用于释放锁。太简单就不举例子了。
重点说下threading.Semaphore
Semaphore 在内部存在一个计数器,在用户调用 acquire() 时,计数器 -1,release() 则+1
举个例子说明下吧,刚好用下下午的简单测试代码:
1 from selenium import webdriver 2 import threading 3 import time 4 import random 5 6 7 def first_test(url): 8 sem.acquire() # 注意要第一时间去修改计数器 这点很重要 9 firsttest = webdriver.Chrome() 10 try: 11 firsttest.get(url) # 发送get请求 12 time.sleep(random.randint(0, 50)) # 为了看清变化 random设置的比较大 13 except Exception as ErrorInfo: 14 print(ErrorInfo) 15 finally: 16 sem.release() 17 firsttest.close() # 关闭谷歌浏览器 18 19 20 if __name__ == '__main__': 21 url = 'http://www.cnblogs.com/Dracular/p/8365989.html' 22 sem = threading.Semaphore(3) # 设置线程阀值 23 for i in range(10): 24 t = threading.Thread(target=first_test, args=(url,)) 25 t.start() 26 time.sleep(0.1) 27 28 while threading.active_count() != 1: 29 pass # print threading.active_count() 30 else: 31 print('### Selenium Jobs is over!!!###')
由于为了保证计数器的不为负(因为变成负数,就相当于阻塞了哦....),最好使用finally,来进行release()的修改....
好了,点滴积累......