提到Python的多线程,大家都说鸡肋。至于为什么,一定又要说什么“GIL的全称是Global Interpreter Lock(全局解释器锁)”之类的解释了,哥书读的少,听不太懂,反正能让我们这种村里人看到同时跑了几个就行,至于什么多线程多进程,CPU是并行还是并发的,都随他去吧。
今天主要说一下threading模块的进程锁与进程管理内容。
用threading有几次,都是简单的有两个或者三个任务需要并发执行,比如服务器的主备等等,不用管它锁不锁的。但这次想用于管理几百个任务的依次并发,不得不看看了。
先说下threading.lock()
由于存在多个进程共同去修改某个数据的问题,所以必须要用到lock()
这东西比较简单,lock.acquire()用于添加锁,lock.release() 用于释放锁。太简单就不举例子了。
重点说下threading.Semaphore
Semaphore 在内部存在一个计数器,在用户调用 acquire() 时,计数器 -1,release() 则+1
举个例子说明下吧,刚好用下下午的简单测试代码:
复制代码
1 from selenium import webdriver
2 import threading
3 import time
4 import random
5
6
7 def first_test(url):
8 sem.acquire() # 注意要第一时间去修改计数器 这点很重要
9 firsttest = webdriver.Chrome()
10 try:
11 firsttest.get(url) # 发送get请求
12 time.sleep(random.randint(0, 50)) # 为了看清变化 random设置的比较大
13 except Exception as ErrorInfo:
14 print(ErrorInfo)
15 finally:
16 sem.release()
17 firsttest.close() # 关闭谷歌浏览器
18
19
20 if name == ‘main’:
21 url = ‘http://www.cnblogs.com/Dracular/p/8365989.html’
22 sem = threading.Semaphore(3) # 设置线程阀值
23 for i in range(10):
24 t = threading.Thread(target=first_test, args=(url,))
25 t.start()
26 time.sleep(0.1)
27
28 while threading.active_count() != 1:
29 pass # print threading.active_count()
30 else:
31 print(’### Selenium Jobs is over!!!###’)
复制代码
由于为了保证计数器的不为负(因为变成负数,就相当于阻塞了哦…),最好使用finally,来进行release()的修改…
好了,点滴积累…