linux下的守护程序(daemon)对应于windows下的服务程序。长期运行于后台。通常不提供UI支持,随系统启动而启动。
守护程序的启动和停止指令通常为(以apache2为例):service apache2 start/stop
在前面的博客中有一篇《基于linux TCP的select服务器》,本文以该服务器的代码为基础,将其改造为一个daemon程序,实现用service *** start / stop来控制其启动和停止。
并进而实现开机启动。
在《unix环境高级编程》中,守护程序的创建异常复杂。主要包含以下步骤:
(1)创建子进程,父进程退出。
(2)在子进程中中创建新会话
(3)设置当前目录为根目录
(4)重设文件权限掩码
(5)关闭文件描述符
因为《unix环境高级编程》和《Linux/UNIX系统编程手册》中均提供了例子。故本文不对此过程作演示。
既然创建daemon程序的流程已固定,是否我们每次都要造轮子呢?
好在linux中提供了一个系统调用可以直接使进程变为守护程序:int daemon(int nochdir, int noclose);
下面来看守护程序的代码:
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>
#include <sys/select.h>
#include <unistd.h>
#include <stdlib.h>
#include <unordered_map>
#include <string>
#include <iostream>
using namespace std;
//int->fd
//string->ip&port
unordered_map<int, string> clients_addr;
int main(int argc, char const *argv[])
{
daemon(0,0);
int listenfd = socket(AF_INET, SOCK_STREAM | SOCK_NONBLOCK | SOCK_CLOEXEC, IPPROTO_TCP );
struct sockaddr_in serv;
serv.sin_family = AF_INET;
serv.sin_port = htons(5000);
serv.sin_addr.s_addr = inet_addr("127.0.0.1");
int on = 1;
int connfd;
if (setsockopt(listenfd, SOL_SOCKET, SO_REUSEADDR, &on, sizeof(on)) < 0)
{
perror("setsockopt");
exit(EXIT_FAILURE);
}
if (bind(listenfd, (struct sockaddr *)&serv, sizeof(serv)) < 0)
{
perror("bind");
exit(EXIT_FAILURE);
}
if (listen(listenfd, 3) < 0)
{
perror("listen");
exit(EXIT_FAILURE);
}
sockaddr_in peer_addr;
socklen_t peer_addr_len = sizeof(peer_addr);
int maxfd = listenfd;
fd_set fdall, fdread;
FD_ZERO(&fdall);
FD_SET(listenfd, &fdall);
// printf("listen fd = %d\n",listenfd);
while (1)
{
fdread = fdall;
int ret = select(maxfd + 1, &fdread, NULL, NULL, NULL);
if (ret == -1)
{
perror("select");
exit(EXIT_FAILURE);
}
if (ret == 0)
{
continue;
}
for (int i = 0; i <= maxfd; i++)
{
if (FD_ISSET(i, &fdread))
{
if (i == listenfd)
{
connfd = accept4(listenfd, (struct sockaddr *)&peer_addr, &peer_addr_len, SOCK_CLOEXEC | SOCK_NONBLOCK);
char ip_str_buf[1024];
sprintf(ip_str_buf, "%s:%d", inet_ntoa(peer_addr.sin_addr), ntohs(peer_addr.sin_port));
clients_addr[connfd] = ip_str_buf;
cout << clients_addr[connfd] << "-->" << "login" << endl;
FD_SET(connfd, &fdall);
if (maxfd < connfd)
{
maxfd = connfd;
}
}
else
{
char msg_buf[1024] = {0x00};
ret = recv(i, msg_buf, sizeof(msg_buf), 0);
if (ret == -1)
{
perror("recv");
exit(EXIT_FAILURE);
}
if (ret == 0)
{
close(i);
FD_CLR(i, &fdall);
cout << clients_addr[i] << "-->" << "log out" << endl;
}
else
{
cout << clients_addr[i] << "-->" << msg_buf << endl;
ret = send(i, msg_buf, sizeof(msg_buf), 0);
}
}
}
}
}
return 0;
}
和之前博文中代码没有大的区别,只是在程序入口处增加了一个daemon系统调用。
代码中需要注意的是:
(1)没有给出客户端代码。客户端测试可用telnet或netcat。(建议使用netcat,因为telnet只支持TCP,而netcat对TCP/UDP都提供了支持)
(2)使用了C++11标准中的容器unordered_map(哈希表)来存储ip地址。这意味着编译时需要添加-std=c++11或-std=c++0x选项。在使用只支持C++03/98的旧编译器时可使用std::map(红黑树)来替代本文中的unordered_map。
此时服务端代码已经完成。下一步是实现service *** start/stop命令对其进行管理的支持。
linux通过shell脚本来完成此工作。
在etc/init.d中创建一个shell脚本daemon_test (不要忘记添加可执行权限!)
#!bin/bash prog=/home/vagrant/learn_linux/daemon/daemon_test lock=/home/vagrant/learn_linux/daemon/test.lock start(){ $prog start echo "daemon_test starting" touch $lock } stop(){ sudo pkill daemon_test rm -rf $lock } status(){ if [ -e $lock ];then echo "daemon_test running" else echo "daemon_test already stoped" fi } restart(){ stop start } case "$1" in "start") start ;; "stop") stop ;; "status") status ;; "restart") restart ;; *) # echo "??:$0 start|stop|status|restart" ;; esac
脚本代码中需要注意的地方:
(1)脚本中的prog是进程文件的绝对路径,lock是锁定文件的绝对路径。
(2)在stop函数中通常使用killproc指令来结束进程。我的系统(ubuntu 14.04.3)对这个命令没有支持。因此使用pkil来代替。
此时就可以用service daemon_test start/stop来管理守护程序了。
还剩下最后一步:将守护程序设置为开机启动。
有三种办法:(1)RHEL/centos支持的chkconfig。(2)debian/ubuntu支持的update-rc.d (3)即将成为linux事实标准的systemd
我的系统(ubuntu 14.04.3)只提供了对(2)的支持。故暂选择使用 update-rc.d :
update-rc.d daemon_test defaults 99
如此守护程序daemon_test便可开机启动了。在程序作了改动或代码重新编译之后,要先删掉开机启动项然后重新添加才能生效。删除指令如下:
update-rc.d -f daemon_test remove
至此本文的目的已达到。
PS:(1)笔者曾接触过windows下服务程序的开发。仅仅从windows 服务与linux daemon的开发对比来看,不得不说还是linux对程序员更友好。。。(2)本文中前面的守护进程代码没有对信号做处理,错误处理也可抽出来。因仅作示例之用,没做优化。
(3)文中使用的编译器是gcc(g++) 4.6.3。
(4)本文中提到的服务/守护程序不等于通常所说客户/服务器模型中的“服务端程序”。两者不是一个概念。
(5) daemon调用不是posix标准的一部分,最早出现在bsd 4.4中。