本文给出了一个通用的线程池框架,该框架将与线程执行相关的任务进行了高层次的抽象,使之与具体的执行任务无关。另外该线程池具有动态伸缩性,它能根据执行任务的轻重自动调整线程池中线程的数量。文章的最后,我们给出一个简单示例程序,通过该示例程序,我们会发现,通过该线程池框架执行多线程任务是多么的简单。
为什么需要线程池
目前的大多数网络服务器,包括Web服务器、Email服务器以及数据库服务器等都具有一个共同点,就是单位时间内必须处理数目巨大的连接请求,但处理时间却相对较短。
传统多线程方案中我们采用的服务器模型则是一旦接受到请求之后,即创建一个新的线程,由该线程执行任务。任务执行完毕后,线程退出,这就是是“即时创建,即时销毁”的策略。尽管与创建进程相比,创建线程的时间已经大大的缩短,但是如果提交给线程的任务是执行时间较短,而且执行次数极其频繁,那么服务器将处于不停的创建线程,销毁线程的状态。
我们将传统方案中的线程执行过程分为三个过程:T1、T2、T3。
T1:线程创建时间
T2:线程执行时间,包括线程的同步等时间
T3:线程销毁时间
那么我们可以看出,线程本身的开销所占的比例为(T1+T3) / (T1+T2+T3)。如果线程执行的时间很短的话,这比开销可能占到20%-50%左右。如果任务执行时间很频繁的话,这笔开销将是不可忽略的。
除此之外,线程池能够减少创建的线程个数。通常线程池所允许的并发线程是有上界的,如果同时需要并发的线程数超过上界,那么一部分线程将会等待。而传统方案中,如果同时请求数目为2000,那么最坏情况下,系统可能需要产生2000个线程。尽管这不是一个很大的数目,但是也有部分机器可能达不到这种要求。
因此线程池的出现正是着眼于减少线程池本身带来的开销。线程池采用预创建的技术,在应用程序启动之后,将立即创建一定数量的线程(N1),放入空闲队列中。这些线程都是处于阻塞( Suspended )状态,不消耗 CPU ,但占用较小的内存空间。当任务到来后,缓冲池选择一个空闲线程,把任务传入此线程中运行。当 N1 个线程都在处理任务后,缓冲池自动创建一定数量的新线程,用于处理更多的任务。 在任务执行完毕后线程也不退出,而是继续保持在池中等待下一次的任务。当系统比较空闲时,大部分线程都一直处于暂停状态,线程池自动销毁一部分线程,回收系统资源。
基于这种预创建技术,线程池将线程创建和销毁本身所带来的开销分摊到了各个具体的任务上,执行次数越多,每个任务所分担到的线程本身开销则越小,不过我们另外可能需要考虑进去线程之间同步所带来的开销。
构建线程池框架
一般线程池都必须具备下面几个组成部分:
线程池管理器:用于创建并管理线程池
工作线程: 线程池中实际执行的线程
任务接口: 尽管线程池大多数情况下是用来支持网络服务器,但是我们将线程执行的任务抽象出来,形成任务接口,从而是的线程池与具体的任务无关。
任务队列:线程池的概念具体到实现则可能是队列,链表之类的数据结构,其中保存执行线程。
我们实现的通用线程池框架由五个重要部分组成CThreadManage,CThreadPool,CThread,CJob,CWorkerThread,除此之外框架中还包括线程同步使用的类CThreadMutex和CCondition。
CJob是所有的任务的基类,其提供一个接口Run,所有的任务类都必须从该类继承,同时实现Run方法。该方法中实现具体的任务逻辑。
CThread是Linux中线程的包装,其封装了Linux线程最经常使用的属性和方法,它也是一个抽象类,是所有线程类的基类,具有一个接口Run。
CWorkerThread是实际被调度和执行的线程类,其从CThread继承而来,实现了CThread中的Run方法。
CThreadPool是线程池类,其负责保存线程,释放线程以及调度线程。
CThreadManage是线程池与用户的直接接口,其屏蔽了内部的具体实现。
CThreadMutex用于线程之间的互斥。
CCondition则是条件变量的封装,用于线程之间的同步。
它们的类的继承关系如下图所示:
线程池的时序很简单,如下图所示。CThreadManage直接跟客户端打交道,其接受需要创建的线程初始个数,并接受客户端提交的任务。这儿的任务是具体的非抽象的任务。CThreadManage的内部实际上调用的都是CThreadPool的相关操作。CThreadPool创建具体的线程,并把客户端提交的任务分发给CWorkerThread,CWorkerThread实际执行具体的任务。
理解系统组件
下面我们分开来了解系统中的各个组件。
class CThreadManage { private : CThreadPool* m_Pool; int m_NumOfThread; protected : public : void SetParallelNum( int num); CThreadManage(); CThreadManage(int num); virtual ~CThreadManage(); void Run(CJob* job, void * jobdata); void TerminateAll( void ); }; CThreadManage::CThreadManage(){ m_NumOfThread = 10; m_Pool = new CThreadPool(m_NumOfThread); } CThreadManage::CThreadManage(int num){ m_NumOfThread = num; m_Pool = new CThreadPool(m_NumOfThread); } CThreadManage::~CThreadManage(){ if (NULL != m_Pool) delete m_Pool; } void CThreadManage::SetParallelNum( int num){ m_NumOfThread = num; } void CThreadManage::Run(CJob* job, void * jobdata){ m_Pool->Run(job,jobdata); } void CThreadManage::TerminateAll( void ){ m_Pool->TerminateAll(); } class CThread { private : int m_ErrCode; Semaphore m_ThreadSemaphore; unsigned long m_ThreadID; bool m_Detach; bool m_CreateSuspended; char * m_ThreadName; ThreadState m_ThreadState; protected : void SetErrcode( int errcode){m_ErrCode = errcode;} static void * ThreadFunction( void *); public : CThread(); CThread(bool createsuspended, bool detach); virtual ~CThread(); virtual void Run( void ) = 0; void SetThreadState(ThreadState state){m_ThreadState = state;} bool Terminate( void ); bool Start( void ); void Exit( void ); bool Wakeup( void ); ThreadState GetThreadState(void ){ return m_ThreadState;} int GetLastError( void ){ return m_ErrCode;} void SetThreadName( char * thrname){strcpy(m_ThreadName,thrname);} char * GetThreadName( void ){ return m_ThreadName;} int GetThreadID( void ){ return m_ThreadID;} bool SetPriority( int priority); int GetPriority( void ); int GetConcurrency( void ); void SetConcurrency( int num); bool Detach( void ); bool Join( void ); bool Yield( void ); int Self( void ); }; class CThreadPool { friend class CWorkerThread; private : unsigned int m_MaxNum; unsigned int m_AvailLow; unsigned int m_AvailHigh; unsigned int m_AvailNum; unsigned int m_InitNum; protected : CWorkerThread* GetIdleThread(void ); void AppendToIdleList(CWorkerThread* jobthread); void MoveToBusyList(CWorkerThread* idlethread); void MoveToIdleList(CWorkerThread* busythread); void DeleteIdleThread( int num); void CreateIdleThread( int num); public : CThreadMutex m_BusyMutex; CThreadMutex m_IdleMutex; CThreadMutex m_JobMutex; CThreadMutex m_VarMutex; CCondition m_BusyCond; CCondition m_IdleCond; CCondition m_IdleJobCond; CCondition m_MaxNumCond; vector<CWorkerThread*> m_ThreadList; vector<CWorkerThread*> m_BusyList; vector<CWorkerThread*> m_IdleList; CThreadPool(); CThreadPool(int initnum); virtual ~CThreadPool(); void SetMaxNum( int maxnum){m_MaxNum = maxnum;} int GetMaxNum( void ){ return m_MaxNum;} void SetAvailLowNum( int minnum){m_AvailLow = minnum;} int GetAvailLowNum( void ){ return m_AvailLow;} void SetAvailHighNum( int highnum){m_AvailHigh = highnum;} int GetAvailHighNum( void ){ return m_AvailHigh;} int GetActualAvailNum( void ){ return m_AvailNum;} int GetAllNum( void ){ return m_ThreadList.size();} int GetBusyNum( void ){ return m_BusyList.size();} void SetInitNum( int initnum){m_InitNum = initnum;} int GetInitNum( void ){ return m_InitNum;} void TerminateAll( void ); void Run(CJob* job, void * jobdata); }; CThreadPool::CThreadPool() { m_MaxNum = 50; m_AvailLow = 5; m_InitNum=m_AvailNum = 10 ; m_AvailHigh = 20; m_BusyList.clear(); m_IdleList.clear(); for ( int i=0;i<m_InitNum;i++){ CWorkerThread* thr = new CWorkerThread(); thr->SetThreadPool(this ); AppendToIdleList(thr); thr->Start(); } } CThreadPool::CThreadPool(int initnum) { assert(initnum>0 && initnum<=30); m_MaxNum = 30; m_AvailLow = initnum-10>0?initnum-10:3; m_InitNum=m_AvailNum = initnum ; m_AvailHigh = initnum+10; m_BusyList.clear(); m_IdleList.clear(); for ( int i=0;i<m_InitNum;i++){ CWorkerThread* thr = new CWorkerThread(); AppendToIdleList(thr); thr->SetThreadPool(this ); thr->Start(); } } CThreadPool::~CThreadPool() { TerminateAll(); } void CThreadPool::TerminateAll() { for ( int i=0;i < m_ThreadList.size();i++) { CWorkerThread* thr = m_ThreadList[i]; thr->Join(); } return ; } CWorkerThread* CThreadPool::GetIdleThread(void ) { while (m_IdleList.size() ==0 ) m_IdleCond.Wait(); m_IdleMutex.Lock(); if (m_IdleList.size() > 0 ) { CWorkerThread* thr = (CWorkerThread*)m_IdleList.front(); printf("Get Idle thread %dn" ,thr->GetThreadID()); m_IdleMutex.Unlock(); return thr; } m_IdleMutex.Unlock(); return NULL; } void CThreadPool::AppendToIdleList(CWorkerThread* jobthread) { m_IdleMutex.Lock(); m_IdleList.push_back(jobthread); m_ThreadList.push_back(jobthread); m_IdleMutex.Unlock(); } void CThreadPool::MoveToBusyList(CWorkerThread* idlethread) { m_BusyMutex.Lock(); m_BusyList.push_back(idlethread); m_AvailNum--; m_BusyMutex.Unlock(); m_IdleMutex.Lock(); vector<CWorkerThread*>::iterator pos; pos = find(m_IdleList.begin(),m_IdleList.end(),idlethread); if (pos !=m_IdleList.end()) m_IdleList.erase(pos); m_IdleMutex.Unlock(); } void CThreadPool::MoveToIdleList(CWorkerThread* busythread) { m_IdleMutex.Lock(); m_IdleList.push_back(busythread); m_AvailNum++; m_IdleMutex.Unlock(); m_BusyMutex.Lock(); vector<CWorkerThread*>::iterator pos; pos = find(m_BusyList.begin(),m_BusyList.end(),busythread); if (pos!=m_BusyList.end()) m_BusyList.erase(pos); m_BusyMutex.Unlock(); m_IdleCond.Signal(); m_MaxNumCond.Signal(); } void CThreadPool::CreateIdleThread( int num) { for ( int i=0;i<num;i++){ CWorkerThread* thr = new CWorkerThread(); thr->SetThreadPool(this ); AppendToIdleList(thr); m_VarMutex.Lock(); m_AvailNum++; m_VarMutex.Unlock(); thr->Start(); } } void CThreadPool::DeleteIdleThread( int num) { printf("Enter into CThreadPool::DeleteIdleThreadn" ); m_IdleMutex.Lock(); printf("Delete Num is %dn" ,num); for ( int i=0;i<num;i++){ CWorkerThread* thr; if (m_IdleList.size() > 0 ){ thr = (CWorkerThread*)m_IdleList.front(); printf("Get Idle thread %dn" ,thr->GetThreadID()); } vector<CWorkerThread*>::iterator pos; pos = find(m_IdleList.begin(),m_IdleList.end(),thr); if (pos!=m_IdleList.end()) m_IdleList.erase(pos); m_AvailNum--; printf("The idle thread available num:%d n" ,m_AvailNum); printf("The idlelist num:%d n" ,m_IdleList.size()); } m_IdleMutex.Unlock(); } void CThreadPool::Run(CJob* job, void * jobdata) { assert(job!=NULL); if (GetBusyNum() == m_MaxNum) m_MaxNumCond.Wait(); if (m_IdleList.size()<m_AvailLow) { if (GetAllNum()+m_InitNum-m_IdleList.size() < m_MaxNum ) CreateIdleThread(m_InitNum-m_IdleList.size()); else CreateIdleThread(m_MaxNum-GetAllNum()); } CWorkerThread* idlethr = GetIdleThread(); if (idlethr !=NULL) { idlethr->m_WorkMutex.Lock(); MoveToBusyList(idlethr); idlethr->SetThreadPool(this ); job->SetWorkThread(idlethr); printf("Job is set to thread %d n" ,idlethr->GetThreadID()); idlethr->SetJob(job,jobdata); } } for ( int i=0;i<m_InitNum;i++) { CWorkerThread* thr = new CWorkerThread(); AppendToIdleList(thr); thr->SetThreadPool(this ); thr->Start(); }
在该代码中,我们将创建m_InitNum个线程,创建之后即调用AppendToIdleList放入Idle链表中,由于目前没有任务分发给这些线程,因此线程执行Start后将自己挂起。
事实上,线程池中容纳的线程数目并不是一成不变的,其会根据执行负载进行自动伸缩。为此在CThreadPool中设定四个变量:
m_InitNum:初始创建时线程池中的线程的个数。
m_MaxNum:当前线程池中所允许并发存在的线程的最大数目。
m_AvailLow:当前线程池中所允许存在的空闲线程的最小数目,如果空闲数目低于该值,表明负载可能过重,此时有必要增加空闲线程池的数目。实现中我们总是将线程调整为m_InitNum个。
m_AvailHigh:当前线程池中所允许的空闲的线程的最大数目,如果空闲数目高于该值,表明当前负载可能较轻,此时将删除多余的空闲线程,删除后调整数也为m_InitNum个。
m_AvailNum:目前线程池中实际存在的线程的个数,其值介于m_AvailHigh和m_AvailLow之间。如果线程的个数始终维持在m_AvailLow和m_AvailHigh之间,则线程既不需要创建,也不需要删除,保持平衡状态。因此如何设定m_AvailLow和m_AvailHigh的值,使得线程池最大可能的保持平衡态,是线程池设计必须考虑的问题。
线程池在接受到新的任务之后,线程池首先要检查是否有足够的空闲池可用。检查分为三个步骤:
(1)检查当前处于忙碌状态的线程是否达到了设定的最大值m_MaxNum,如果达到了,表明目前没有空闲线程可用,而且也不能创建新的线程,因此必须等待直到有线程执行完毕返回到空闲队列中。
(2)如果当前的空闲线程数目小于我们设定的最小的空闲数目m_AvailLow,则我们必须创建新的线程,默认情况下,创建后的线程数目应该为m_InitNum,因此创建的线程数目应该为( 当前空闲线程数与m_InitNum);但是有一种特殊情况必须考虑,就是现有的线程总数加上创建后的线程数可能超过m_MaxNum,因此我们必须对线程的创建区别对待。
if(GetAllNum()+m_InitNum-m_IdleList.size() < m_MaxNum )
CreateIdleThread(m_InitNum-m_IdleList.size());
else
CreateIdleThread(m_MaxNum-GetAllNum());
如果创建后总数不超过m_MaxNum,则创建后的线程为m_InitNum;如果超过了,则只创建( m_MaxNum-当前线程总数)个。
(3)调用GetIdleThread方法查找空闲线程。如果当前没有空闲线程,则挂起;否则将任务指派给该线程,同时将其移入忙碌队列。
当线程执行完毕后,其会调用MoveToIdleList方法移入空闲链表中,其中还调用m_IdleCond.Signal()方法,唤醒GetIdleThread()中可能阻塞的线程。
class CWorkerThread: public CThread { private : CThreadPool* m_ThreadPool; CJob* m_Job; void * m_JobData; CThreadMutex m_VarMutex; bool m_IsEnd; protected : public : CCondition m_JobCond; CThreadMutex m_WorkMutex; CWorkerThread(); virtual ~CWorkerThread(); void Run(); void SetJob(CJob* job, void * jobdata); CJob* GetJob(void ){ return m_Job;} void SetThreadPool(CThreadPool* thrpool); CThreadPool* GetThreadPool(void ){ return m_ThreadPool;} }; CWorkerThread::CWorkerThread() { m_Job = NULL; m_JobData = NULL; m_ThreadPool = NULL; m_IsEnd = false ; } CWorkerThread::~CWorkerThread() { if (NULL != m_Job) delete m_Job; if (m_ThreadPool != NULL) delete m_ThreadPool; } void CWorkerThread::Run() { SetThreadState(THREAD_RUNNING); for (;;) { while (m_Job == NULL) m_JobCond.Wait(); m_Job->Run(m_JobData); m_Job->SetWorkThread(NULL); m_Job = NULL; m_ThreadPool->MoveToIdleList(this ); if (m_ThreadPool->m_IdleList.size() > m_ThreadPool->GetAvailHighNum()) { m_ThreadPool->DeleteIdleThread(m_ThreadPool->m_IdleList.size()-m_ThreadPool->GetInitNum()); } m_WorkMutex.Unlock(); } } void CWorkerThread::SetJob(CJob* job, void * jobdata) { m_VarMutex.Lock(); m_Job = job; m_JobData = jobdata; job->SetWorkThread(this ); m_VarMutex.Unlock(); m_JobCond.Signal(); } void CWorkerThread::SetThreadPool(CThreadPool* thrpool) { m_VarMutex.Lock(); m_ThreadPool = thrpool; m_VarMutex.Unlock(); } class CJob { private : int m_JobNo; char * m_JobName; CThread *m_pWorkThread; public : CJob( void ); virtual ~CJob(); int GetJobNo( void ) const { return m_JobNo; } void SetJobNo( int jobno){ m_JobNo = jobno;} char * GetJobName( void ) const { return m_JobName; } void SetJobName( char * jobname); CThread *GetWorkThread(void ){ return m_pWorkThread; } void SetWorkThread ( CThread *pWorkThread ){ m_pWorkThread = pWorkThread; } virtual void Run ( void *ptr ) = 0; };
CJob::CJob( void ) :m_pWorkThread(NULL) ,m_JobNo(0) ,m_JobName(NULL) { } CJob::~CJob(){ if (NULL != m_JobName) free(m_JobName); } void CJob::SetJobName( char * jobname) { if (NULL !=m_JobName) { free(m_JobName); m_JobName = NULL; } if (NULL ==jobname) { m_JobName = (char *)malloc(strlen(jobname)+1); strcpy(m_JobName,jobname); } } class CXJob: public CJob { public : CXJob(){i=0;} ~CXJob(){} void Run( void * jobdata) { printf("The Job comes from CXJOB/n" ); sleep(2); } }; class CYJob: public CJob { public : CYJob(){i=0;} ~CYJob(){} void Run( void * jobdata) { printf("The Job comes from CYJob/n" ); } }; main() { CThreadManage* manage = new CThreadManage(10); for ( int i=0;i<40;i++) { CXJob* job = new CXJob(); manage->Run(job,NULL); } sleep(2); CYJob* job = new CYJob(); manage->Run(job,NULL); manage->TerminateAll(); }
线程池使用后记
线程池适合场合
事实上,线程池并不是万能的。它有其特定的使用场合。线程池致力于减少线程本身的开销对应用所产生的影响,这是有前提的,前提就是线程本身开销与线程执行任务相比不可忽略。如果线程本身的开销相对于线程任务执行开销而言是可以忽略不计的,那么此时线程池所带来的好处是不明显的,比如对于FTP服务器以及Telnet服务器,通常传送文件的时间较长,开销较大,那么此时,我们采用线程池未必是理想的方法,我们可以选择“即时创建,即时销毁”的策略。
总之线程池通常适合下面的几个场合:
(1) 单位时间内处理任务频繁而且任务处理时间短
(2) 对实时性要求较高。如果接受到任务后在创建线程,可能满足不了实时要求,因此必须采用线程池进行预创建。
(3) 必须经常面对高突发性事件,比如Web服务器,如果有足球转播,则服务器将产生巨大的冲击。此时如果采取传统方法,则必须不停的大量产生线程,销毁线程。此时采用动态线程池可以避免这种情况的发生。
结束语
本文给出了一个简单的通用的与任务无关的线程池的实现,通过该线程池能够极大的简化Linux下多线程的开发工作。该线程池的进一步完善开发工作还在进行中,希望能够得到你的建议和支持。
参考资料
http://www-900.ibm.com/developerWorks/cn/java/j-jtp0730/index.shtml
POSIX多线程程序设计,David R.Butenhof 译者:于磊 曾刚,中国电力出版社
C++面向对象多线程编程,CAMERON HUGHES等著 周良忠译,人民邮电出版社
Java Pro,结合线程和分析器池,Edy Yu
关于作者
张中庆,西安交通大学软件所,在读硕士,目前研究方向为分布式网络与移动中间件.