引言:前面的一系列文章都在说了事件模型,也就是简单的做一个介绍,然后贴出了一些代码作为Demo,上次说到了在反应堆中的超时管理。今天就来说说关于利用最小堆来管理超时的问题。
NOTICE:判断一个事件是否超时的方法是, 事件超时时间 减 当前时间 ,如果大于零,说明没有超时,如果小于零,说明该事件超时了。
一般做法是怎样来管理所有的超时事件呢?以前的用法都是利用链表来保存所有的超时事件,轮训查看是否事件超时,若超时就采取相应的措施,比如移除事件等。后来的Nginx和libevent采取了更好的措施,Nginx是利用红黑树来管理,而libevent是利用最小堆来管理。
今天的主题是最小堆,所以下面的内容都是围绕最小堆来展开。
这里说说最小堆的好处,然后接着说明为什么要利用最小堆来管理超时事件。
最小堆的好处:
(1)最小堆的设计简单,易于实现
(2)插入和删除操作都是在log(n)基础上完成
(3)获取最小值是O(1)
为什么要利用最小堆:
大家都知道在IO多路复用中比如 select() 和 epoll() 都有一个超时的最大时间,也就是说,如果没有监听到事件,最大的阻塞时间就是这参数。
当我们在Reactor中加入了一个超时事件的时候,我们就利用这个最小堆中的根节点的时间减去当前时间作为select/epoll超时的最大值。所以,当select/epoll返回的时候得到函数执行的消耗的时间,查看最小堆的根是否超时(NOTICE),如果没有超时,我们继续正常步骤,如果超时就采取相应措施,比如超时事件的回调函数等,然后继续查看新的堆结构的根节点,直到处理不超时的情况出现,因为堆是自适应的,所以根部必然是值最小的,如果这个事件没有超时,就可以停止超时事件的处理 了。
所以总体来看,每次都会找到最小堆中最小的元素作为比较,事件复杂度是O(1)
最小堆的性质:
所有父节点总是小于或等于所有的子节点(递归定义),看做二叉树的话是完全二叉树
看看最小堆的实现:
结构表示:
typedef struct heap_node_s
{
int index;
int key ;
}mc_minheap_node_t ;
typedef struct min_heap_s
{
mc_minheap_node_t *node_list ;
int headindex ;
int lastindex ;
size_t max_num ;
}mc_minheap_t;
几个宏:
#define MAX_INT 0x0fffffff
#define PARENT(i) ((i)/(2))
#define LEFTCHILD(i) ((i)*(2))
#define RIGHTCHILD(i) (((i)*(2))+(1))
插入:
每次插入到堆的末尾,然后逐层比较,直到大于父节点。
int mc_minheap_insert( mc_minheap_t *mh ,int key )
{
if( mh == NULL )
return -1;
int lastindex = mh->lastindex;
mh->node_list[lastindex].key = key ;
mh->node_list[lastindex].index = lastindex ;
int tindex = lastindex ;
//heap top
if( lastindex == 1 )
{
mh->lastindex++ ;
return 1;
}
else
{
if( lastindex >= mh->max_num -1 )
return -1;
while( tindex != 1 )
{
if( key < mh->node_list[PARENT( tindex )].key )
{
swap_node( &(mh->node_list[tindex]), &(mh->node_list[PARENT( tindex )]) );
}
tindex = PARENT( tindex );
}
}
mh->lastindex++ ;
return 1;
}
删除:
删除的时候,把需要删除的节点与堆的最后一个节点交换,删除这个节点。然后交换后的这个节点与子节点中较小的一个比较,如果大于它就交换,如果小于就结束,直到没有子节点。
int mc_minheap_rm( mc_minheap_t *mh )
{
if( mh == NULL )
return -1;
int ret = mh->node_list[1].key ;
mh->node_list[1].key = MAX_INT ;
mc_minheap_node_t * pnode = &(mh->node_list[1]) ;
mc_minheap_node_t *minnode ;
swap_node( pnode , &(mh->node_list[mh->lastindex]));
int i = 1 ;
for( ; i < mh->lastindex ; i++ )
{
minnode = mh->node_list[LEFTCHILD(i)].key <= mh->node_list[RIGHTCHILD(i)].key ? &(mh->node_list[LEFTCHILD(i)]) : &(mh->node_list[RIGHTCHILD(i)]);
if( i == mh->max_num -1 )
break ;
if( minnode->key == MAX_INT )
break ;
if( pnode.key > minnode.key )
swap_node( pnode , minnode );
else
break;
pnode = minnode ;
}
mh->lastindex-- ;
return ret ;
}
int mc_minheap_rm_index( mc_minheap_t *mh ,int index )
{
if( mh == NULL )
return -1;
if( index > mh->lastindex )
return -1;
int ret = mh->node_list[index].key ;
mh->node_list[index].key = MAX_INT ;
mc_minheap_node_t * pnode = &(mh->node_list[index]) ;
mc_minheap_node_t *minnode ;
swap_node( pnode , &(mh->node_list[mh->lastindex]));
int i = index ;
for( ; i < mh->lastindex ; i++ )
{
minnode = mh->node_list[LEFTCHILD(i)].key <= mh->node_list[RIGHTCHILD(i)].key ? &(mh->node_list[LEFTCHILD(i)]) : &(mh->node_list[RIGHTCHILD(i)]);
if( i == mh->max_num -1 )
break ;
if( minnode->key == MAX_INT )
break ;
if( pnode.key > minnode.key )
swap_node( pnode , minnode );
else
break;
pnode = minnode ;
}
mh->lastindex-- ;
return ret ;
}
初始化和交换节点:
mc_minheap_t * mc_minheap_ini(int nodenum )
{
int i = 0 ;
if( nodenum <= 0 )
return NULL;
mc_minheap_t * mh = ( mc_minheap_t *)malloc( sizeof( mc_minheap_t ));
if( mh == NULL )
{
return NULL;
}
mh->node_list = (mc_minheap_node_t *)malloc( sizeof(mc_minheap_node_t )*nodenum );
mh->headindex = 1 ;
mh->lastindex= 1 ;
for( i = 0 ; i < nodenum ; i++ )
{
mh->node_list[i].key = MAX_INT ;
mh->node_list[i].index = i+1;
}
mh->max_num = nodenum ;
return mh;
}
static int swap_node( mc_minheap_node_t * n1 , mc_minheap_node_t *n2 )
{
if( n1 == NULL || n2 == NULL )
return -1;
mc_minheap_node_t temp;
temp.key = n1->key ;
n1->key = n2->key;
n2->key = temp.key ;
}
总结:最小堆的设计方式比较简单,但是功能不错,有一个缺点就是初始化的时候需要固定大小的节点个数,如果超时事件过多,需要采取一定的措施来保证堆的代码质量。或许可以采用多个对的方式,然后比较每一个堆的最小值,这样也就是O(N)复杂度,N= 堆的个数,这里是我的一厢情愿罢了..
文章如有错误请指正,我会在收到留言的第一时间修改。欢迎交流