在项目中,有时需要并发处理多个任务,可以使用多线程技术。但是由于机器限制,不能说有多少个任务,就开启多少个线程,那么这里就涉及到单条线程多次执行任务的方法。例如有1万个任务,开启30条线程来处理,每个线程处理完一个任务,就继续处理下一个任务,直到任务全部执行完毕。
思路:
重写threading.Thread类的run方法。因为线程在start之后,就会执行run方法,执行完这个方法后线程就会join退出,所以我就想到了改写run方法来实现。
以下是代码演示:
实例场景:假设有10000个任务在队列里,开启30个线程来循环执行任务,每次执行完一个任务,都从队列里删除这个任务,直到任务全部结束。下面代码在python 2.7.3上成功执行,注释都写在代码里了:
#!/usr/bin/env python
#coding=utf8
import threading
from Queue import Queue
#假设有10000个任务
myqueue = Queue(10000)
for i in range(10000):
myqueue.put('task%d' % (i + 1))
'''
任务执行方法,任务执行完成就被移除
以下只是简单输出任务执行字符串,并记录日志
'''
def foo():
try:
task = myqueue.get_nowait()
except Exception, e:
pass
print '%s execute!' % task
logfile = open('./log.txt', 'a')
print >> logfile, '%s finish!' % task
logfile.close()
#自定义线程类,继承threading.Thread
class MyThread(threading.Thread):
def __init__(self, func, args=(), name=''):
super(MyThread, self).__init__(target=func, args=args, name=name)
self.name = name
self.func = func
self.args = args
'''
重写threading.Thread的run方法
在这个方法中,会循环检测myqueue是否还有任务
'''
def run(self):
while myqueue.qsize() > 0:
self.func()
#主方法
def main():
#开启30条线程来执行
threads = []
nloops = range(30)
for i in nloops:
t = MyThread(foo)
threads.append(t)
for i in nloops:
threads[i].start()
for i in nloops:
threads[i].join()
if __name__ == '__main__':
main()
执行这个文件,屏幕上会输出一堆字符串,这个估计也看不清,不用管,打开日志文件log.txt查看。以下是我的日志文件结果,正好1万条数据,其中你会发现task不是按照顺序执行,这个是因为线程之间本来就是异步的,只要任务之间没有关联,是没有关系的。
python中单条线程多次执行任务