Python实现线程池

最新推荐文章于 2024-06-14 17:01:05 发布

满舅娘

最新推荐文章于 2024-06-14 17:01:05 发布

阅读量231

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mmqqyyqqyyq/article/details/87598893

版权

Java开发新方式：专注UI，快速开发

浏览 5317 次

锁定老帖子主题：Python实现线程池精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
jeffreydan 等级: 性别: 文章: 10 积分: 100 来自: 北京	发表时间：2011-03-02 最后修改：2011-05-03 < > 猎头职位: 北京: 【北京】游戏公司诚邀php开发工程师相关文章: 学完线程,摸索着写了个线程池,有待完善 MongoDB 内存解析 python 设计Python数据库连接池1-对象的循环引用问题推荐群组: 高级语言虚拟机更多相关推荐 Python 最近在做一些文本处理方面的事情，考虑到程序利用并发性可以提高执行效率（不纠结特殊反例），于是入围的Idea如使用多进程或多线程达到期望的目标，对于进程或线程的创建是有代价的，那么我们是否可以实现一个线程池来达到已创建的线程反复使用从而使代价降低到最小呢？当然可以，要想创建一个线程池，那么必须得有个容器来模拟“池”，在Python中，队列这样的数据结构就可以帮我们解决“池”这个问题，然而随之引来的多线程之间数据处理同步问题，好在Python中有个Queue模块帮我们解决了这一棘手的问题，那么我们就可以实现一个线程池的雏形了。 Python代码 # !/usr/bin/env python # -- coding:utf-8 -- import Queue import threading import time class WorkManager(object): def __init__(self, work_num=1000,thread_num=2): self.work_queue = Queue.Queue() self.threads = [] self.__init_work_queue(work_num) self.__init_thread_pool(thread_num) """ 初始化线程 """ def __init_thread_pool(self,thread_num): for i in range(thread_num): self.threads.append(Work(self.work_queue)) """ 初始化工作队列 """ def __init_work_queue(self, jobs_num): for i in range(jobs_num): self.add_job(do_job, i) """ 添加一项工作入队 """ def add_job(self, func, args): self.work_queue.put((func, list(args)))#任务入队，Queue内部实现了同步机制 """ 等待所有线程运行完毕 """ def wait_allcomplete(self): for item in self.threads: if item.isAlive():item.join() class Work(threading.Thread): def __init__(self, work_queue): threading.Thread.__init__(self) self.work_queue = work_queue self.start() def run(self): #死循环，从而让创建的线程在一定条件下关闭退出 while True: try: do, args = self.work_queue.get(block=False)#任务异步出队，Queue内部实现了同步机制 do(args) self.work_queue.task_done()#通知系统任务完成 except: break #具体要做的任务 def do_job(args): time.sleep(0.1)#模拟处理时间 print threading.current_thread(), list(args) if __name__ == '__main__': start = time.time() work_manager = WorkManager(10000, 10)#或者work_manager = WorkManager(10000, 20) work_manager.wait_allcomplete() end = time.time() print "cost all time: %s" % (end-start) 2次开启不同的线程数运行结果如下： Python代码 #work_manager = WorkManager(10000, 10) cost all time: 100.641790867(单位：秒) #work_manager = WorkManager(10000, 20) cost all time：50.5233478546(单位：秒) 上面实现了线程池的雏形，展现了基本原理，当然要想成为通用的API需要做很多的工作，希望本文能够起到抛砖引玉的效果。声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接 Java开发新方式：专注UI，快速开发！*
返回顶楼

passionke 等级: 初级会员性别: 文章: 77 积分: 0 来自: 杭州	发表时间：2011-03-10 这个太长了吧～其实我还是怀念flex框架下的“多线程”式写法就是开num事件，然后在事件结束后判断是否满足运行完毕的条件如果是就跳出如果不是再来一轮可惜在线程中，似乎没有线程析构的说法也就是当线程完毕的时候我们是拿不到信号的（while 轮询？不好）看到过一个简易版本的线程池哪个简单干净利于理解
返回顶楼	回帖地址 0 0 请登录后投票

simomo 等级: 初级会员性别: 文章: 11 积分: 50 来自: 郑州	发表时间：2011-03-11 最近做一个项目，也需要用到一个线程池，所以找了一个老外的开源项目中用的线程池代码，总共有 task， workthread， threadpool三大部分。不太清楚的是你说的queue是什么lib？ Python代码 import threading class WorkerTask(object): """A task to be performed by the ThreadPool.""" def __init__(self, function, args=(), kwargs={}): self.function = function self.args = args self.kwargs = kwargs def __call__(self): self.function(self.args, self.kwargs) class WorkerThread(threading.Thread): """A thread managed by a thread pool.""" def __init__(self, pool): threading.Thread.__init__(self) self.setDaemon(True) self.pool = pool self.busy = False self._started = False self._event = None def work(self): if self._started is True: if self._event is not None and not self._event.isSet(): self._event.set() else: self._started = True self.start() def run(self): while True: self.busy = True while len(self.pool._tasks) > 0: try: task = self.pool._tasks.pop() task() except IndexError: # Just in case another thread grabbed the task 1st. pass # Sleep until needed again self.busy = False if self._event is None: self._event = threading.Event() else: self._event.clear() self._event.wait() class ThreadPool(object): """Executes queued tasks in the background.""" def __init__(self, max_pool_size=10): self.max_pool_size = max_pool_size self._threads = [] self._tasks = [] def _addTask(self, task): self._tasks.append(task) worker_thread = None for thread in self._threads: if thread.busy is False: worker_thread = thread break if worker_thread is None and len(self._threads) <= self.max_pool_size: worker_thread = WorkerThread(self) self._threads.append(worker_thread) if worker_thread is not None: worker_thread.work() def addTask(self, function, args=(), kwargs={}): self._addTask(WorkerTask(function, args, kwargs)) class GlobalThreadPool(object): """ThreadPool Singleton class.""" _instance = None def __init__(self): """Create singleton instance """ if GlobalThreadPool._instance is None: # Create and remember instance GlobalThreadPool._instance = ThreadPool() def __getattr__(self, attr): """ Delegate get access to implementation """ return getattr(self._instance, attr) def __setattr__(self, attr, val): """ Delegate set access to implementation """ return setattr(self._instance, attr, val) 线程池的研究及实现什么是线程池？诸如web服务器、数据库服务器、文件服务器和邮件服务器等许多服务器应用都面向处理来自某些远程来源的大量短小的任务。构建服务器应用程序的一个过于简单的模型是：每当一个请求到达就创建一个新的服务对象，然后在新的服务对象中为请求服务。但当有大量请求并发访问时，服务器不断的创建和销毁对象的开销很大。所以提高服务器效率的一个手段就是尽可能减少创建和销毁对象的次数，特别是一些很耗资源的对象创建和销毁，这样就引入了“池”的概念，“池”的概念使得人们可以定制一定量的资源，然后对这些资源进行复用，而不是频繁的创建和销毁。线程池是预先创建线程的一种技术。线程池在还没有任务到来之前，创建一定数量的线程，放入空闲队列中。这些线程都是处于睡眠状态，即均为启动，不消耗CPU，而只是占用较小的内存空间。当请求到来之后，缓冲池给这次请求分配一个空闲线程，把请求传入此线程中运行，进行处理。当预先创建的线程都处于运行状态，即预制线程不够，线程池可以自由创建一定数量的新线程，用于处理更多的请求。当系统比较闲的时候，也可以通过移除一部分一直处于停用状态的线程。线程池的注意事项虽然线程池是构建多线程应用程序的强大机制，但使用它并不是没有风险的。在使用线程池时需注意线程池大小与性能的关系，注意并发风险、死锁、资源不足和线程泄漏等问题。（1）线程池大小。多线程应用并非线程越多越好，需要根据系统运行的软硬件环境以及应用本身的特点决定线程池的大小。一般来说，如果代码结构合理的话，线程数目与CPU 数量相适合即可。如果线程运行时可能出现阻塞现象，可相应增加池的大小；如有必要可采用自适应算法来动态调整线程池的大小，以提高CPU 的有效利用率和系统的整体性能。（2）并发错误。多线程应用要特别注意并发错误，要从逻辑上保证程序的正确性，注意避免死锁现象的发生。（3）线程泄漏。这是线程池应用中一个严重的问题，当任务执行完毕而线程没能返回池中就会发生线程泄漏现象。简单线程池的设计一个典型的线程池，应该包括如下几个部分： 1、线程池管理器（ThreadPool），用于启动、停用，管理线程池 2、工作线程（WorkThread），线程池中的线程 3、请求接口（WorkRequest），创建请求对象，以供工作线程调度任务的执行 4、请求队列（RequestQueue）,用于存放和提取请求 5、结果队列（ResultQueue）,用于存储请求执行后返回的结果线程池管理器，通过添加请求的方法（putRequest）向请求队列（RequestQueue）添加请求，这些请求事先需要实现请求接口，即传递工作函数、参数、结果处理函数、以及异常处理函数。之后初始化一定数量的工作线程，这些线程通过轮询的方式不断查看请求队列（RequestQueue），只要有请求存在，则会提取出请求，进行执行。然后，线程池管理器调用方法（poll）查看结果队列（resultQueue）是否有值，如果有值，则取出，调用结果处理函数执行。通过以上讲述，不难发现，这个系统的核心资源在于请求队列和结果队列，工作线程通过轮询requestQueue获得人物，主线程通过查看结果队列，获得执行结果。因此，对这个队列的设计，要实现线程同步，以及一定阻塞和超时机制的设计，以防止因为不断轮询而导致的过多cpu开销。在本文中，将会用python语言实现，python的Queue，就是很好的实现了对线程同步机制。使用Python实现： #--encoding:utf-8-*- ''' Created on 2012-3-9 @summary: 线程池 @contact: mailto:zhanglixinseu@gmail.com @author: zhanglixin ''' import sys import threading import Queue import traceback # 定义一些Exception，用于自定义异常处理 class NoResultsPending(Exception): """

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python实现线程池

Python实现线程池
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。