定时是指在一段时间之后触发某段代码的机制,我们可以在这段代码中依次处理所有到期的定时器。
Linux提供了三种定时方法,它们是:
- socket选项
SO_RCVTIMEO
和SO_SNDTIMEO
- SIGALRM信号
- I/O复用系统调用的超时参数
一、socket超时
这两个选项用来设置socket接收数据超时时间和发送数据超时时间。这两个选项仅对与数据接收和发送相关的socket专用系统调用,这些系统调用包括send
、sendmsg
、recv
、recvmsg
、accept
、connect
。
系统调用 | 有效选项 | 超时后的行为 |
---|---|---|
send | SO_SNDTIMEO | 返回-1,设置errno为EAGAIN或EWOULDBLOCK |
sendmsg | SO_SNDTIMEO | 返回-1,设置errno为EAGAIN或EWOULDBLOCK |
recv | SO_RCVTIMEO | 返回-1,设置errno为EAGAIN或EWOULDBLOCK |
recvmsg | SO_RCVTIMEO | 返回-1,设置errno为EAGAIN或EWOULDBLOCK |
accept | SO_RCVTIMEO | 返回-1,设置errno为EAGAIN或EWOULDBLOCK |
connect | SO_SNDTIMEO | 返回-1,设置errno为EWOULDBLOCK |
int timeout_connect( const char* ip, int port, int time )
{
struct sockaddr_in address;
bzero( &address, sizeof( address ) );
address.sin_family = AF_INET;
inet_pton( AF_INET, ip, &address.sin_addr );
address.sin_port = htons( port );
int sockfd = socket( PF_INET, SOCK_STREAM, 0 );
struct timeval timeout;
// 超时时间的秒部分
timeout.tv_sec = time;
// 超时时间的微秒部分
timeout.tv_usec = 0;
// 获取结构体长度
socklen_t len = sizeof( timeout );
// 将超时时间设置到套接字上,以确保连接操作在超时时间内完成
int ret = setsockopt( sockfd, SOL_SOCKET, SO_SNDTIMEO, &timeout, len );
// 尝试连接目标服务器
ret = connect( sockfd, ( struct sockaddr* )&address, sizeof( address ) );
// 如果连接失败
if ( ret == -1 )
{
// 如果连接正在进行中,即出现了非阻塞连接的情况,打印连接超时信息并返回 -1
if( errno == EINPROGRESS )
{
printf( "connecting timeout\n" );
return -1;
}
printf( "error occur when connecting to server\n" );
return -1;
}
// 返回连接好的socket文件描述符
return sockfd;
}
二、SIGALRM信号
由alarm
和setitimer
函数设置的实时闹钟一旦超时,将触发SIGALRM信号。因此,我们可以利用该信号的信号处理函数来处理定时任务。但是,如果要处理多个定时任务,我们就需要不断地触发SIGALRM信号,并在其信号处理函数中执行到期的任务。
一般而言,SIGALRM信号按照固定的频率生成,即由alarm
或setitimer
函数设置的定时周期T保持不变。如果某个定时任务的超时时间不是T的整数倍,那么它实际被执行的时间和预期的时间将略有偏差。因此定时周期T反映了定时的精度。
2.1、基于升序链表的定时器
定时器通常至少要包含两个成员:一个超时时间(相对时间或者绝对时间)和一个任务回调函数。有的时候还可能包含回调函数被执行时需要传入的参数,以及是否重启定时器等信息。如果使用链表作为容器来串联所有的定时器,则每个定时器还要包含指向下一个定时器的指针成员。进一步,如果链表是双向的,则每个定时器还需要包含指向前一个定时器的指针成员。
#ifndef LST_TIMER
#define LST_TIMER
#include <time.h>
#define BUFFER_SIZE 64
class util_timer;
struct client_data
{
sockaddr_in address;
int sockfd;
char buf[ BUFFER_SIZE ];
util_timer* timer;
};
class util_timer
{
public:
util_timer() : prev( NULL ), next( NULL ){}
public:
time_t expire;
void (*cb_func)( client_data* );
client_data* user_data;
util_timer* prev;
util_timer* next;
};
class sort_timer_lst
{
public:
sort_timer_lst() : head( NULL ), tail( NULL ) {}
~sort_timer_lst()
{
util_timer* tmp = head;
while( tmp )
{
head = tmp->next;
delete tmp;
tmp = head;
}
}
void add_timer( util_timer* timer )
{
if( !timer ) return;
if( !head )
{
head = tail = timer;
return;
}
if( timer->expire < head->expire )
{
timer->next = head;
head->prev = timer;
head = timer;
return;
}
add_timer( timer, head );
}
void adjust_timer( util_timer* timer )
{
if( !timer )
{
return;
}
util_timer* tmp = timer->next;
if( !tmp || ( timer->expire < tmp->expire ) )
{
return;
}
if( timer == head )
{
head = head->next;
head->prev = NULL;
timer->next = NULL;
add_timer( timer, head );
}
else
{
timer->prev->next = timer->next;
timer->next->prev = timer->prev;
add_timer( timer, timer->next );
}
}
void del_timer( util_timer* timer )
{
if( !timer ) return;
if( ( timer == head ) && ( timer == tail ) )
{
delete timer;
head = NULL;
tail = NULL;
return;
}
if( timer == head )
{
head = head->next;
head->prev = NULL;
delete timer;
return;
}
if( timer == tail )
{
tail = tail->prev;
tail->next = NULL;
delete timer;
return;
}
timer->prev->next = timer->next;
timer->next->prev = timer->prev;
delete timer;
}
void tick()
{
if( !head ) return;
printf( "timer tick\n" );
// 获取当前时间戳
time_t cur = time( NULL );
// 遍历链表
util_timer* tmp = head;
while( tmp )
{
// 时间还没到,退出
if( cur < tmp->expire )
{
break;
}
// 否则调用函数
tmp->cb_func( tmp->user_data );
// 改变头
head = tmp->next;
if( head ) head->prev = NULL;
delete tmp;
tmp = head;
}
}
private:
util_timer* head;
util_timer* tail;
void add_timer( util_timer* timer, util_timer* lst_head )
{
util_timer* prev = lst_head;
util_timer* tmp = prev->next;
while( tmp )
{
if( timer->expire < tmp->expire )
{
prev->next = timer;
timer->next = tmp;
tmp->prev = timer;
timer->prev = prev;
break;
}
prev = tmp;
tmp = tmp->next;
}
if( !tmp )
{
prev->next = timer;
timer->prev = prev;
timer->next = NULL;
tail = timer;
}
}
};
#endif
核心函数tick
相当于一个心搏函数,它每隔一段固定的时间就执行一次,以检测并处理到期的任务。判断定时任务到期的依据是定时器的expire值小于当前的系统时间。从执行效率来看,添加定时器的时间复杂度是O(n),删除定时器的时间复杂度是O(1),执行定时任务的时间复杂度是O(1)。
2.2、处理非活动连接
利用alarm函数周期性地触发SIGALRM信号,该信号的信号处理函数利用管道通知主循环执行定时器链表上的定时任务——关闭非活动的连接。
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <assert.h>
#include <stdio.h>
#include <signal.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <fcntl.h>
#include <stdlib.h>
#include <sys/epoll.h>
#include <pthread.h>
#include "lst_timer.h"
#define FD_LIMIT 65535
#define MAX_EVENT_NUMBER 1024
#define TIMESLOT 5
static int pipefd[2];
static sort_timer_lst timer_lst;
static int epollfd = 0;
int setnonblocking( int fd )
{
int old_option = fcntl( fd, F_GETFL );
int new_option = old_option | O_NONBLOCK;
fcntl( fd, F_SETFL, new_option );
return old_option;
}
void addfd( int epollfd, int fd )
{
epoll_event event;
event.data.fd = fd;
event.events = EPOLLIN | EPOLLET;
epoll_ctl( epollfd, EPOLL_CTL_ADD, fd, &event );
setnonblocking( fd );
}
void sig_handler( int sig )
{
int save_errno = errno;
int msg = sig;
send( pipefd[1], ( char* )&msg, 1, 0 );
errno = save_errno;
}
void addsig( int sig )
{
struct sigaction sa;
memset( &sa, '\0', sizeof( sa ) );
sa.sa_handler = sig_handler;
sa.sa_flags |= SA_RESTART;
sigfillset( &sa.sa_mask );
assert( sigaction( sig, &sa, NULL ) != -1 );
}
void timer_handler()
{
timer_lst.tick();
alarm( TIMESLOT );
}
void cb_func( client_data* user_data )
{
epoll_ctl( epollfd, EPOLL_CTL_DEL, user_data->sockfd, 0 );
assert( user_data );
close( user_data->sockfd );
printf( "close fd %d\n", user_data->sockfd );
}
int main( int argc, char* argv[] )
{
if( argc <= 2 )
{
printf( "usage: %s ip_address port_number\n", basename( argv[0] ) );
return 1;
}
const char* ip = argv[1];
int port = atoi( argv[2] );
int ret = 0;
struct sockaddr_in address;
bzero( &address, sizeof( address ) );
address.sin_family = AF_INET;
inet_pton( AF_INET, ip, &address.sin_addr );
address.sin_port = htons( port );
int listenfd = socket( PF_INET, SOCK_STREAM, 0 );
assert( listenfd >= 0 );
ret = bind( listenfd, ( struct sockaddr* )&address, sizeof( address ) );
assert( ret != -1 );
ret = listen( listenfd, 5 );
assert( ret != -1 );
epoll_event events[ MAX_EVENT_NUMBER ];
int epollfd = epoll_create( 5 );
assert( epollfd != -1 );
addfd( epollfd, listenfd );
ret = socketpair( PF_UNIX, SOCK_STREAM, 0, pipefd );
assert( ret != -1 );
setnonblocking( pipefd[1] );
addfd( epollfd, pipefd[0] );
// add all the interesting signals here
addsig( SIGALRM );
addsig( SIGTERM );
bool stop_server = false;
client_data* users = new client_data[FD_LIMIT];
bool timeout = false;
alarm( TIMESLOT );
while( !stop_server )
{
int number = epoll_wait( epollfd, events, MAX_EVENT_NUMBER, -1 );
if ( ( number < 0 ) && ( errno != EINTR ) )
{
printf( "epoll failure\n" );
break;
}
for ( int i = 0; i < number; i++ )
{
int sockfd = events[i].data.fd;
if( sockfd == listenfd )
{
struct sockaddr_in client_address;
socklen_t client_addrlength = sizeof( client_address );
int connfd = accept( listenfd, ( struct sockaddr* )&client_address, &client_addrlength );
addfd( epollfd, connfd );
users[connfd].address = client_address;
users[connfd].sockfd = connfd;
util_timer* timer = new util_timer;
timer->user_data = &users[connfd];
timer->cb_func = cb_func;
time_t cur = time( NULL );
timer->expire = cur + 3 * TIMESLOT;
users[connfd].timer = timer;
timer_lst.add_timer( timer );
}
else if( ( sockfd == pipefd[0] ) && ( events[i].events & EPOLLIN ) )
{
int sig;
char signals[1024];
ret = recv( pipefd[0], signals, sizeof( signals ), 0 );
if( ret == -1 )
{
// handle the error
continue;
}
else if( ret == 0 )
{
continue;
}
else
{
for( int i = 0; i < ret; ++i )
{
switch( signals[i] )
{
case SIGALRM:
{
timeout = true;
break;
}
case SIGTERM:
{
stop_server = true;
}
}
}
}
}
else if( events[i].events & EPOLLIN )
{
memset( users[sockfd].buf, '\0', BUFFER_SIZE );
ret = recv( sockfd, users[sockfd].buf, BUFFER_SIZE-1, 0 );
printf( "get %d bytes of client data %s from %d\n", ret, users[sockfd].buf, sockfd );
util_timer* timer = users[sockfd].timer;
if( ret < 0 )
{
if( errno != EAGAIN )
{
cb_func( &users[sockfd] );
if( timer )
{
timer_lst.del_timer( timer );
}
}
}
else if( ret == 0 )
{
cb_func( &users[sockfd] );
if( timer )
{
timer_lst.del_timer( timer );
}
}
else
{
//send( sockfd, users[sockfd].buf, BUFFER_SIZE-1, 0 );
if( timer )
{
time_t cur = time( NULL );
timer->expire = cur + 3 * TIMESLOT;
printf( "adjust timer once\n" );
timer_lst.adjust_timer( timer );
}
}
}
else
{
// others
}
}
if( timeout )
{
timer_handler();
timeout = false;
}
}
close( listenfd );
close( pipefd[1] );
close( pipefd[0] );
delete [] users;
return 0;
}
三、IO复用定时
Linux下的三个IO复用函数都有超时参数:
#define TIMEOUT 5000
int timeout = TIMEOUT;
time_t start = time( NULL );
time_t end = time( NULL );
while( 1 ) {
printf( "the timeout is now %d mill-seconds\n", timeout );
start = time( NULL );
int number = epoll_wait( epollfd, events, MAX_EVENT_NUMBER, timeout );
if( ( number < 0 ) && ( errno != EINTR ) )
{
printf( "epoll failure\n" );
break;
}
// 如果epoll_wait成功返回0,则说明超时时间到,此时便可处理定时任务,并重置定时时间
if( number == 0 )
{
// timeout
timeout = TIMEOUT;
continue;
}
// 如果epoll_wait的返回值大于0,则本次epoll_wait调用持续的时间是(end-start)*1000 ms,
// 我们需要将定时时间timeout减去这段时间,以获得下次epoll_wait调用的超时参数
end = time( NULL );
timeout -= ( end - start ) * 1000;
// 重新计算之后的timeout值有可能等于0,说明本次epoll_wait调用返回时
// 不仅有文件描述符就绪,而且其超时时间也刚好到达,此时我们也要处理定时任务,并重置定时时间
if( timeout <= 0 ) timeout = TIMEOUT;
/***********************
* 处理定时任务
***********************/
}
四、高性能定时器
4.1、时间轮
基于排序链表的定时器存在一个问题,添加定时器、删除定时器的效率偏低。时间轮解决了这个问题
如上图,还是一个个的链表,只不过像哈希表一样被散列了。指针指向轮上的一个槽,它以恒定的速度顺时针转动,每转动一步就指向下一个槽(从实线指向变成虚线指向),每次转动称为一个tick。一个滴答的时间称为时间轮的槽间隔
s
i
si
si(slot interval)。时间轮一共有
N
N
N个槽,因此他运转一周的时间为
N
∗
s
i
N*si
N∗si 。每个槽指向一条定时器链表,每条链表上的定时器具有相同的特征:它们的定时时间相差N*si的整数倍。假如现在指针指向槽
c
s
cs
cs,我们要添加一个定时时间为
t
i
ti
ti的定时器,则该定时器将被插入槽
t
s
ts
ts(timer slot)对应的链表中:
t
s
=
(
c
s
+
(
t
i
/
s
i
)
)
%
N
ts = (cs + (ti / si)) \% N
ts=(cs+(ti/si))%N
对时间轮而言,要提高定时精度,就要使si值足够小;要提高执行效率,则要求N值足够大。
4.2、时间堆
前面讨论的定时方案都是以固定的频率调用心搏函数tick,并在其中依次检测到期的定时器,然后执行到期定时器上的回调函数。
另外一种思路是:将所有定时器中超时时间最小的一个定时器的超时值作为心搏间隔。这样,一旦心搏函数tick被调用,超时时间最小的定时器必然到期,我们就可以在tick函数中处理该定时器。然后,再次从剩余的定时器中找出超时时间最小的一个,并将这段最小时间设置为下一次心搏间隔。如此反复,就实现了较为精确的定时。
最小堆很适合处理这种定时方案。最小堆是指每个节点的值都小于或等于其子节点的值的完全二叉树。
最小堆的插入:在树的下一个空闲位置创建一个空穴。如果X可以放在空穴中而不破坏堆序,则插入完成,否则交换空穴和他的父节点,直到X可以放入空穴。
最小堆的删除:在根节点处创建一个空穴。由于堆现在少了一个元素,因此我们可以把堆的最后一个元素X移动到该堆的某个地方。如果X可以被放入空穴,则删除操作完成。否则交换空穴和它的两个儿子节点中的较小者,再判断是否可以插入X。
最小堆是完全二叉树,所以可以用数组表示,对于数组中的任意一个位置i上的元素,其左儿子节点在位置2i+1上,其右儿子节点在位置2i+2上,其父节点则在位置 [ ( i − 1 ) / 2 ] ( i > 0 ) [(i-1)/2](i>0) [(i−1)/2](i>0)上。
堆化的过程:
- 选择根节点: 从要堆化的数组中选择一个节点作为根节点。
- 比较父节点和子节点: 如果是最大堆,那么父节点的值应该比它的子节点的值都大;如果是最小堆,那么父节点的值应该比它的子节点的值都小。根据堆的性质,进行相应的比较。
- 调整位置: 如果父节点与其中一个子节点的值不符合堆的性质,那么它们需要交换位置。这个过程被称为"下沉"(percolate down)或"调整"(heapify down)。交换后,继续对交换后的子节点进行相同的比较和调整,直到当前节点满足堆的性质或者到达叶子节点。
- 递归: 重复上述过程,直到整个数组或指定部分满足堆的性质。
实际上,我们只需要对数组中的第 [ ( N − 1 ) / 2 ] [(N-1)/2] [(N−1)/2] ~ 0 0 0个元素执行上述操作,只要确保非叶子节点构成的子树都具有堆序性质,整个树就具有堆序性质。