深入浅出 NXLog (一)

转自 http://www.jianshu.com/p/ac9f5ae4beb9

1. NXLog 简介

nxlog 是用 C 语言写的一个开源日志收集处理软件,它是一个模块化、多线程、高性能的日志管理解决方案,支持多平台。今天我主要分析一下 nxlog 的启动流程,基于的 code 版本是 nxlog-ce-2.8.1248

2. NXLog 启动流程图

NXLog 启动流程

上图是 nxlog 启动的一个大致流程图,大家可以先看一眼,对整个流程有个大致认识,具体的解析下面奉上。

3. NXLog 启动详解

下面根据启动流程的各个步骤分别进行分析。

3.1 NXLog Init

    nxlog->ctx = nx_ctx_new();
    nx_ctx_register_builtins(nxlog->ctx);

    CHECKERR(apr_thread_mutex_create(&(nxlog->mutex), APR_THREAD_MUTEX_UNNESTED, nxlog->pool));
    CHECKERR(apr_thread_cond_create(&(nxlog->event_cond), nxlog->pool));
    CHECKERR(apr_thread_cond_create(&(nxlog->worker_cond), nxlog->pool));

nxlog_init 主要干了三件事情。
1. 通过 nx_ctx_new 接口创建一个configuration context。ctx 很重要,主要用来存储 nxlog 的配置,module,jobgroups 等信息。
2. 通过 nx_ctx_register_builtins 接口绑定 IN, OUT 以及 CORE 模块的 callback。下面以 IN 模块为例来进行说明。

static void nx_ctx_register_builtin_inputfuncs()
{
    nx_module_input_func_register(NULL, "linebased",
                  &nx_module_input_func_linereader, NULL, NULL);

    nx_module_input_func_register(NULL, "dgram",
                  &nx_module_input_func_dgramreader, NULL, NULL);
    nx_module_input_func_register(NULL, "binary",
                  &nx_module_input_func_binaryreader, NULL, NULL);
}

Input module 提供三种 callback。根据数据源的不同分为 linebased,dgram,binary 三种方式。linebased 代表log一行一行切分的,适用于读取日志文件。dgram 代表log是一个包一个包来切分的,适用于接收 UDP syslog 消息。binary 代表数据源为二进制流。nxlog 的配置文件里每个 module 下面有个 InputType 选项,我们可以把它分别配置成 LineBased,Dgram,Binary 来实现相应的功能。
3. 通过 apr_thread_mutex_createapr_thread_cond_create 创建 互斥锁(nxlog->mutex) 和条件变量(nxlog->event_cond 和 nxlog->worker_cond)。这里我们看到 nxlog 有使用 APR(Apache Portable Runtime)的接口,在 nxlog 里很多涉及到平台相关的代码都是调用 APR 的接口来实现的,以此来实现跨平台。
互斥锁,是一种信号量,常用来防止两个进程或线程在同一时刻访问共享资源。条件变量(Condtion Variable)是在多线程程序中用来实现“等待” -> “唤醒”逻辑的常用方法。
NXLog 使用的是生产者消费者模式,该模式需要有一个缓冲区处于生产者和消费者之间,生产者把数据放入缓冲区,而消费者从缓冲区取出数据。这个缓冲区在 NXLog 里叫做 jobqueue,jobqueue属于共享资源,我们需要使用 nxlog->mutex 对多个线程进行同步,防止多个线程同时访问 jobqueue 而导致数据出错。
既然是生产者消费者模式,那就有可能出现生产者快于消费者或者消费者快于生产者的情况。当生产者快于消费者时,我们首先想到的是 jobqueque 会不会满,事实上 jobqueue 是用一个双向链表来实现的,它只是负责把各种 event 链在一起,本身并不维护一块内存空间,真正消耗内存的是 event 本身,所以理论上只要 event 能创建就没有问题。但是如果程序经常出现这种情况,那就代表处理能力不足,影响运行效率。为了不出现这种问题,消费者这一块 nxlog 是用线程池来实现的(在后面 Create threads 我们再细说),这也就是它号称多线程,高性能的原因。
下面再来看看当消费者快于生产者的情况,出现这种情况后,我们就发现 jobqueue 是空的,这时我们不希望消费者忙等而消耗资源,而是希望他们睡眠,当有新的 event 产生时再唤醒消费者。这就需要上面我们说到的条件变量,消费者调用 apr_thread_cond_wait 睡眠,当生产者有消息时调用 apr_thread_cond_signal 来唤醒消费者。

3.2 NXLog parse configuration

NXLog 的配置分为两部分,一部分通过命令行参数的方式带进来,不过这部分配置很少,大多数配置还是通过配置文件的方式下发。
1. Command line
命令行就没有什么好说的了, 主要是用来指定运行方式以及配置文件路径等。

    static const apr_getopt_option_t options[] = {
    { "help", 'h', 0, "print help" }, 
    { "foreground", 'f', 0, "run in foreground" },
    { "stop", 's', 0, "stop a running instance" },
    { "reload", 'r', 0, "reload configuration of a running instance" },
    { "conf", 'c', 1, "configuration file" }, 
    { "verify", 'v', 0, "verify configuration file syntax" },
    { NULL, 0, 1, NULL }, 
    };
  1. Config File
    配置文件会被解析成一个config tree,nxlog 通过递归调用 nx_cfg_parse 接口对配置文件进行逐行(如果在行尾有反斜杠 ‘\’, 会把多行并作一行)分析,最后返回一个 cfgtree,这个 tree 中的每个节点都保存了一行配置中的指令和参数,同时它还会保存父节点,子节点以及兄弟节点的地址。
    这样就把配置文件保存在数据结构 cfgtree 中,最后在每个 module 启动之前会调用这个 module 的 config 接口,这个接口遍历该模块缓存在 cfgtree 中的配置,然后使能这些配置,这样 config file 的使命就完成了。关于 config file 的写法以及每个 module 的配置选项有很多,在此我就不赘述,不清楚的朋友可以参考 doc/reference-manual 目录,在 config-examples 目录下有一些配置模板,在 en 目录下有参考手册 nxlog-reference-manual.pdf,这里面关于 config file 讲的很详细。

3.3 Read config cache

Config cache 里保存了 nxlog 上次采集的位置,比如文件的话它会记录文件的名字以及最后一次的 offset,这样当 nxlog 重启后它就知道上次采集到了那里,然后沿着上一次采集的位置继续采集,这样就避免了重复采集。针对日志采集,我们比较忌讳的有两点,一是丢数据,二就是重复采集,这两种情况都会导致采集上来的日志和原来的日志不一致。
Nxlog 在启动的时候调用 nx_config_cache_read 接口,把 configcache.dat 文件里保存的信息读出并保存在 config_cache 数据结构中,采集文件的模块启动时候会在 config_cache 里查找有没有某个文件的数据,如果不存在就从文件的开头或者末尾开始读取,如果存在就调用 apr_file_seek 移动文件指针到上次读取的位置,当 nxlog 要退出的时候将更新 config_cache 到文件最新的读取位置,然后调用 nx_config_cache_write 将 config_cache 回写到 configcache.dat 文件中。

3.4 Add & config modules

Nxlog 会首先遍历 cfgtree, 针对所有的 module(共有4种, input, output, processor, extension) 分别调用 nx_module_add 接口。该接口会调用 nx_module_new 创建一个 module,然后再调用 nx_module_load_dso 绑定该 module 的方法,等一些必要的初始化都完成后会将该 module 放到 ctx->modules 链表中统一管理。

        if ( strcasecmp(curr->directive, "input") == 0 )
        {
        if ( curr->first_child == NULL )
        {
            nx_conf_error(curr, "empty 'Input' block");
        }

        nx_module_add(ctx, curr->first_child, curr->args, NX_MODULE_TYPE_INPUT);
        }
        else if ( strcasecmp(curr->directive, "processor") == 0 )
        {
        if ( curr->first_child == NULL )
        {
            nx_conf_error(curr, "empty 'Processor' block");
        }

        nx_module_add(ctx, curr->first_child, curr->args, NX_MODULE_TYPE_PROCESSOR);
        }
        else if ( strcasecmp(curr->directive, "output") == 0 )
        {
        if ( curr->first_child == NULL )
        {
            nx_conf_error(curr, "empty 'Output' block");
        }
        nx_module_add(ctx, curr->first_child, curr->args, NX_MODULE_TYPE_OUTPUT);
        }
        else if ( strcasecmp(curr->directive, "extension") == 0 )
        {
        if ( curr->first_child == NULL )
        {
            nx_conf_error(curr, "empty 'Extension' block");
        }

        nx_module_add(ctx, curr->first_child, curr->args, NX_MODULE_TYPE_EXTENSION);
        }

接着 NXLog 会遍历 ctx->modules 链表,分别调用每个 module 的 config 方法对该 module 进行配置,然后会解析该 module 的 “Exec” 以及 “Schedule” 配置。Nxlog 确实比较强大,不仅能采集各种类型的日志,而且还能通过 “Exec” 执行一些任务,比如日志过滤等,还能通过 “Schedule” 做一些任务调度,比如定期进行日志归档等。

    ASSERT(module->status == NX_MODULE_STATUS_UNINITIALIZED);

    if ( module->decl->config != NULL )
    {
    module->decl->config(module);
    }
    else
    {
    nx_module_empty_config_check(module);
    }

    module->exec = nx_module_parse_exec_block(module, module->pool, module->directives);
    nx_module_parse_schedule_blocks(module);

3.5 Init modules

NXLog 会遍历 ctx->modules 链表,得到每个 module,然后调用 nx_module_init 接口对该 module 进行初始化。nx_module_init 也没干什么事情,只是调用该 module 的 init 方法。

    for ( module = NX_DLIST_FIRST(ctx->modules);
      module != NULL;
      module = NX_DLIST_NEXT(module, link) )
    {
    try
    {
        nx_module_init(module);
        if ( module->type == NX_MODULE_TYPE_INPUT )
        {
        num_input++;
        }
    }

3.6 Init routes and jobs

Route 顾名思义就是路由,它定义数据从哪个 INPUT 模块采集,经过哪个 PROCESSOR(不是必须的) 模块处理,送到哪个 OUTPUT 模块。Route 包含两个配置,一个是 “Path”,它定义了数据的流动方向。第二个是 “Priority”,它定义了该 route 的优先级,路由会将自己的优先级赋值给 path 中的各个 module。

    while ( curr != NULL )
    {
    if ( strcasecmp(curr->directive, "route") == 0 )
    {
        if ( nx_add_route(ctx, curr, curr->args) == TRUE )
        {
        num_routes++;
        }
    }
    curr = curr->next;
    }

Nxlog 维护一个 jobgroups 链表,该链表按照优先级顺序存放着许多 jobgroup,相同优先级的 module 会把他们的 job 挂到同一个 jobgroup->jobs 上面。worker_thread 会优先从 priority 高的 jobgroup 里取 job,最终演变下来就是 priority 高的 module 的 event 会优先得到处理。

    ASSERT(ctx != NULL);
    ctx->jobgroups = apr_palloc(ctx->pool, sizeof(nx_jobgroups_t));
    NX_DLIST_INIT(ctx->jobgroups, nx_jobgroup_t, link);

    for ( module = NX_DLIST_FIRST(ctx->modules);
      module != NULL;
      module = NX_DLIST_NEXT(module, link) )
    {
    jobgroup = nx_ctx_get_jobgroup(ctx, module->priority);
    job = apr_pcalloc(ctx->pool, sizeof(nx_job_t));
    NX_DLIST_INSERT_TAIL(&(jobgroup->jobs), job, link);
    module->job = job;
    }

3.7 Create threads

NXLog 会创建一个 event_thread 和多个 worker_thread。究竟会创建几个 worker_thread 由 num_worker_thread 变量来决定,下面来说说这个 num_worker_thread。
如果配置文件里配置了 "Threads"num_worker_thread 将会被设置成该值。如果没有配置,nxlog 会根据配置文件里配置的 module 的个数以及所有 module 的 pollset 个数计算得到 num_worker_thread,具体算法可以参见 nxlog_create_threads 函数,在此我就不赘述。当配置文件里配了很多 module 的时候,这个数值有可能会大于 CPU core 的数量,这时可能会有人认为这是没用的,因为这些 threads 不可能同时得到执行,而且会增加系统的工作量(内存,调度的开销)。在我看来这要分情况,如果这些 worker_thread 从事的是 CPU 密集型的工作,我觉得这种观点是正确的。但是如果这些 worker_thread 从事的是 IO 密集型的工作,这种观点就值得推敲了,IO 密集型的工作一个显著的特点是 Thread 在 IO 不 Ready 的情况下会睡眠,这样即使你起的 thread 数量超过了 CPU core 的数量,但由于很多 thread 都处于睡眠状态,真正执行的 thread 并不多。针对 IO 密集型的工作,增加 thread 数量是能显著提升性能的,但也不是越多越好,当 thread 数量太多的时候反而会走向另一个极端。
event_thread 主要是处理延时的 event,它会从 ctx->events 中依次取出 event, 当该 event 的 time 已经超时了 event_thread 会把该 event 交给 worker_thread 来处理。如果没有超时会得到离当前时间最近的一个 event 要超时的时间,然后调用 apr_thread_cond_timedwait sleep 这么长的时间,等醒来后再去处理这个 event,当然在 sleep 的这段时间内如有新的 event 产生会调用 apr_thread_cond_signal(nxlog->event_cond) 唤醒 event_thread。由于 event_thread 干的事情不多,因此只需要一个。
worker_thread 先通过 nx_ctx_next_job 接口获取一个 event,如果没有 event 可处理,worker_thread 会调用 apr_thread_cond_wait(nxlog->worker_cond, nxlog->mutex) 睡眠,等有新的 event 产生时会调用 apr_thread_cond_signal(nxlog->worker_cond) 把它唤醒。如果有 event 会调用 nx_event_process 来处理。nx_ctx_next_job 获取 event 有一定的讲究,他会优先获取 priority 高的 module 的 event,它是通过优先遍历 priority 高的 jobgroup 来实现的,前面创建 jobgroups 的时候我们就说过,nxlog 会把不同 priority 的 module 的 job 放到不同 priority 的 jobgroup 中。

    nxlog->worker_threads = apr_palloc(nxlog->pool, sizeof(apr_thread_t *) * nxlog->num_worker_thread);
    nxlog->worker_threads_running = apr_pcalloc(nxlog->pool, sizeof(uint32_t) * nxlog->num_worker_thread);

    log_debug("spawning %d worker threads", nxlog->num_worker_thread);
    for ( i = 0; i < nxlog->num_worker_thread; i++)
    {
    nx_thread_create(&(nxlog->worker_threads[i]), NULL, nxlog_worker_thread, NULL, nxlog->pool);
    }

    nx_thread_create(&(nxlog->event_thread), NULL, nxlog_event_thread, NULL, nxlog->pool);

3.8 Start modules

NXLog 会遍历 ctx->modules 链表,得到每个 module,然后调用 nx_module_start 启动该 module。nx_module_start 会发送 NX_EVENT_MODULE_START event 给 worker_thread,worker_thread 收到该 event 后会调用 nx_module_start_self,绕了一圈后真正干活的才出现,nx_module_start_self 会首先获取该 module 的状态,如果是 NX_MODULE_STATUS_STOPPED 会调用该 module 的 start 接口,然后把它的状态置成 NX_MODULE_STATUS_RUNNING。

    ASSERT(nx_module_get_status(module) == NX_MODULE_STATUS_STOPPED);

    if ( module->decl->start != NULL )
    {
    module->decl->start(module);
    }
    nx_module_add_scheduled_events(module);

    nx_module_set_status(module, NX_MODULE_STATUS_RUNNING);

3.9 Main loop

nxlog_mainloop 没干什么事情,一直调用 apr_sleep(NX_POLL_TIMEOUT),把 CPU 让给 event_thread 和 worker_threads。
当 nxlog 收到 SIGTERM, SIGINT, SIGQUIT 这三个信号中的任何一个时,terminate_request 会被置成 TRUE,nxlog_mainloop 结束,Nxlog 调用 nxlog_exit 执行 stop/shutdown module, 结束 event_thread, worker_threads, 回写 config cache,remove pidfile,回收资源等动作,最后 Nxlog 进程退出。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: PCS7是西门子公司生产的一种工业自动化控制系统,是一种功能强大且易于使用的平台,用于控制和监控工业过程中的各种设备和系统。PCS7深入浅出 V8是PCS7的一个版本,它在之前的版本基础上进行了技术升级和功能扩展。 PCS7深入浅出 V8拥有更加直观和用户友好的界面,使操作更加简单易学。它采用了全新的图形组织和设计方式,使得用户可以更轻松地理解和使用系统。同时,它还提供了更多的可定制性,可以根据用户的需求进行个性化配置和设置。 在功能方面,PCS7深入浅出 V8具有更高的可靠性和稳定性。它采用了分布式架构,可以同时控制多个设备和系统,实现更加复杂的工艺过程控制。同时,它还具备故障诊断和报警功能,可以及时发现和解决问题,确保工业生产的连续性和稳定性。 PCS7深入浅出 V8还拥有更强大的数据处理和分析能力。它可以实时采集和存储大量的工业数据,并通过先进的算法和模型进行分析和预测。这样,用户可以根据数据的分析结果进行调整和优化,提高生产效率和质量。 总的来说,PCS7深入浅出 V8是一款功能强大且易于使用的工业自动化控制系统。通过它,用户可以更加轻松地控制和监控工业过程中的各种设备和系统,实现更高效、更可靠的工业生产。 ### 回答2: PCS7是西门子工业自动化控制系统中的一款重要软件,它的最新版本是V8。PCS7深入浅出 V8指的是对于PCS7 V8版本的深入理解和简单易懂的介绍。 PCS7 V8是在之前版本的基础上进行了升级和改进,以提供更高效、更稳定、更灵活的自动化控制系统。它具有以下几个重要特点: 首先,PCS7 V8在硬件和软件方面都进行了优化。在硬件方面,它支持多种不同类型的通信协议,可以与各种工业设备进行连接,实现数据的传输和控制。在软件方面,PCS7 V8增加了许多新功能和模块,包括智能监控、故障诊断、过程数据分析等,进一步提高了系统的自动化程度和控制精度。 其次,PCS7 V8具有良好的可扩展性和灵活性。它支持分布式控制架构,可以将控制任务分散到不同的控制器上,实现系统的并行运行和负载均衡。同时,PCS7 V8的功能模块和监控界面都支持自定义设置,可以根据用户的需求进行个性化定制,满足不同行业和企业的特殊需求。 再次,PCS7 V8具备强大的数据处理和分析能力。它可以实时采集和存储大量的过程数据,支持数据的查询、统计和报表生成等功能,帮助用户对生产过程进行全面监控和分析。同时,PCS7 V8还可以与企业级信息系统进行集成,实现生产数据的共享和优化,提高企业的生产效率和竞争力。 综上所述,PCS7 V8是一款功能强大、性能优越的自动化控制系统软件,它通过深入浅出的方式,为用户提供了更简单易懂的操作界面和更全面精细的控制功能。无论是在工业生产还是其他领域,PCS7 V8都能帮助用户实现自动化控制和智能化管理,提高生产效率和产品质量。 ### 回答3: PCS7是西门子(Siemens)公司推出的一款自动化系统软件,它能够广泛应用于工业自动化领域的控制系统中。PCS7深入浅出 v8 是PCS7软件的一个新版本,它在前一版本的基础上进行了一些改进和升级。 首先,PCS7深入浅出 v8在系统可靠性方面进行了改进。它采用了分布式控制技术,可以将控制任务分配给多个控制单元,提高了系统的容错性和可靠性。同时,它还具备故障自诊断功能,能够实时检测系统中的故障并给出相应的报警信息,方便工程师进行故障处理。 其次,PCS7深入浅出 v8在网络通信方面进行了优化。它支持多种网络通信协议,能够与其他设备和系统进行无缝集成。同时,它还具备远程监控和控制功能,使得工程师可以通过互联网对远程设备进行监控和控制,提高了生产效率和管理效果。 此外,PCS7深入浅出 v8还具备强大的数据处理能力。它可以实时采集、存储和分析系统中的各种数据,对生产过程进行监控和优化。同时,它还提供了丰富的数据展示和报表生成功能,方便用户进行数据分析和决策。 综上所述,PCS7深入浅出 v8是一款功能强大、性能稳定的工业自动化系统软件。它的改进和升级使得工业生产过程更加可靠、高效、智能化。通过使用PCS7深入浅出 v8,企业可以提高生产效率,降低运营成本,提高竞争力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值