网络爬虫四-将程序设计为守护进程

在Linux或者unix操作系统中在系统的引导的时候会开启很多服务,这些服务就叫做守护进程。为了增加灵活性,root可以选择系统开启的模式,这些模式叫做运行级别,每一种运行级别以一定的方式配置系统。 守护进程是脱离于终端并且在后台运行的进程。守护进程脱离于终端是为了避免进程在执行过程中的信息在任何终端上显示并且进程也不会被任何终端所产生的终端信息所打断。
由于在Linux中,每一个系统与用户进行交流的界面称为终端,每一个从此终端开始运行的进程都会依附于这个终端,这个终端就称为这些进程的控制终端,当控制终端被关闭时,相应的进程都会自动关闭。但是守护进程却能够突破这种限制,它从被执行开始运转,直到整个系统关闭时才退出。如果想让某个进程不因为用户或终端或其他变化而受到影响,那么就必须把这个进程变成一个守护进程。
我们用一个函数来封装守护进程相关代码,同时使用命令行参数控制我们的爬虫是否以守护进程的方式运行。

static void daemonize()  
{  
    int fd;  
    if (fork() != 0) exit(0);  
    setsid();  
    SPIDER_LOG(SPIDER_LEVEL_INFO, "Daemonized...pid=%d", (int)getpid());      

    /* redirect stdin|stdout|stderr to /dev/null */  
    if ((fd = open("/dev/null", O_RDWR, 0)) != -1) {  
        dup2(fd, STDIN_FILENO);  
        dup2(fd, STDOUT_FILENO);  
        dup2(fd, STDERR_FILENO);  
        if (fd > STDERR_FILENO)  
            close(fd);  
    }  

    /* redirect stdout to logfile */  
    if (g_conf->logfile != NULL && (fd = open(g_conf->logfile, O_RDWR | O_APPEND | O_CREAT, 0)) != -1) {  
        dup2(fd, STDOUT_FILENO);  
        if (fd > STDERR_FILENO)  
            close(fd);  
    }  

}  

命令行参数处理代码:

int daemonized = 0;  
char ch;  

/* parse opt */  
while ((ch = getopt(argc, (char* const*)argv, "vhd")) != -1) {  
    switch(ch) {  
        case 'v':  
            version();  
            break;  
        case 'd':  
            daemonized = 1;  
            break;  
        case 'h':  
        case '?':  
        default:  
            usage();  
    }  
}  
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值