大家好,我是artleaf,也就是培培。从今天开始,我将会进行apache源码的分析。其实之前就很想分析apache源码了,但是一直是自己偷懒,给自己找借口,因为apache源码比较多,大概有28万行吧,很艰巨的工作呀。而且本身我也是一个水平很低的小程序员,深怕自己吃不下来,毕竟apache是开源里面已经相当成熟的软件了,里面的代码的质量是相当的高,是多少牛人经过无数次推敲而出来的,我一个对it技术似懂非懂的人,怎么能弄懂这个软件,而且懂it的人都知道,apache占领着世界60%的服务器市场,这么一个强悍的软件,要想弄懂它不是一件容易的事情,而且也不是一朝一夕的事情。但是总归是要做的,现在不做,以后可能就没有时间做了,所以硬着头皮,开始一点一点的分析吧。所以此贴会不定期更新,因为我没有办法保证自己每一周可以分析出来一些东西,但是我会尽量做好。
看apache 需要你了解C语言的知识,这个是必须的,因为apache是由C语言写出来的,其次是学过数据结构,Linux的知识暂时不必要求太深,本身我的Linux知识很肤浅,但是随着分析的深入,需要再知道什么知识,我们在说。我们首先是要分析apache的内存结构,就是apache的apr库,这个对于上述知识已经够了。我分析的是apache的httpd-2.2.15这个版本,apr库中memory中的apr_pools.c这个程序有2602行。我们首先分析的就是这个程序。为什么要分析这个程序呢?其实很久之前就有一个人在做分析apache的源码了,就是张中庆师兄,张师兄在csdn上有博客叫做tingya的专栏,大家有兴趣的可以去看看,张师兄的技术就比较强悍了,我刚开始看apache的知识的时候,就是通过张师兄的apache分析来看的,但是张师兄水平比较高,所以很多地方都是一笔带过,讲的很精练,像我水平这么低的人,要琢磨半天才能明白张师兄的深意。这里我开始的分析,就没有张师兄那么厉害,我只是为了提升自己对软件开放的理解,也对大型软件的掌握,同时提升下自己的计算机软件编程技术水平才想分析apache这个软件的。在tingya的专栏里面我们可以看到为什么会先分析apr库,下面我选自张师兄的话:对于APR中的所有的对象中,内存池对象应该是其余对象内存分配的基础,不仅是APR中的对象,而且对于整个Apache中的大部分对象的内存都是从内存池中进行分配的,因此我们将把内存池作为整个APR的基础。而apr库是apache的基础,所以我们从apr库开始分析。但是之前我们先分析下main函数,来给apache有个有个整体的认识。
好,首先我们先来看看apache的main()函数。这个是apache的开始,
#include "apr.h"
#include "apr_strings.h"
#include "apr_getopt.h"
#include "apr_general.h"
#include "apr_lib.h"
#include "apr_md5.h"
#include "apr_time.h"
#include "apr_version.h"
#include "apu_version.h"
#include "apr_want.h"
#include "ap_config.h"
#include "httpd.h"
#include "http_main.h"
#include "http_log.h"
#include "http_config.h"
#include "http_core.h"
#include "http_vhost.h"
#include "apr_uri.h"
#include "util_ebcdic.h"
#include "ap_mpm.h"
#include "mpm_common.h"
这些是apache中main函数中声明的21个头文件,我们可以看到这里面第一个是apr库的声明。之后有字符串处理的头文件也有加密的头文件等等。暂时我们先不用管这么多。这里只是先给出一个概念。之后我们看下main()函数的变量的定义,
char c;
int configtestonly = 0;
const char *confname = SERVER_CONFIG_FILE;
const char *def_server_root = HTTPD_ROOT;
const char *temp_error_log = NULL;
const char *error;
process_rec *process;
server_rec *server_conf;
apr_pool_t *pglobal;
apr_pool_t *pconf;
apr_pool_t *plog;
apr_pool_t *ptemp;
apr_pool_t *pcommands;
apr_getopt_t *opt;
apr_status_t rv;
module **mod;
const char *optarg;
APR_OPTIONAL_FN_TYPE(ap_signal_server) *signal_server;
我们可以看到,红色的部分都是从内存池中分配出来的,关于内存池的概念,我们下一次对apr库分析的时候会给出解释。从这些变量我们也可以看出,内存分配也是多么的基础。之后我们来看下main函数里面调用的各个函数。
AP_MONCONTROL(0);
process = init_process(&argc, &argv);
ap_server_argv0 = process->short_name;
apr_pool_create(&pcommands, pglobal);
apr_pool_tag(pcommands, "pcommands");
ap_server_pre_read_config = apr_array_make(pcommands, 1, sizeof(char *));
ap_server_post_read_config = apr_array_make(pcommands, 1, sizeof(char *));
ap_server_config_defines = apr_array_make(pcommands, 1, sizeof(char *));
apr_getopt_init(&opt, pcommands, process->argc, process->argv);
apr_pool_create(&plog, pglobal);
apr_pool_tag(plog, "plog");
apr_pool_create(&ptemp, pconf);
apr_pool_tag(ptemp, "ptemp");
apr_pool_destroy(ptemp);
ap_fixup_virtual_hosts(pconf, server_conf);
ap_fini_vhost_config(pconf, server_conf);
apr_hook_sort_all();
apr_pool_clear(plog);
apr_pool_destroy(ptemp);
apr_pool_lock(pconf, 1);
ap_run_optional_fn_retrieve();
apr_pool_lock(pconf, 0);
destroy_and_exit_process(process, 0);
这里几乎包含了main函数里面所有的函数的调用,但是还是有一部分,在这里我们先忽略,大家不要被我罗列在这里的这些只知其名,不知其意的函数所吓倒,我们一点一点的分析。我们首先只需要关注apr库中内存池的各个函数。也就是我上面用红色标注的函数。
虽然我们在主函数中屏蔽掉了很多代码,或许是在主程序中非常有用的代码,但是我们先要分析的是apr库里面的内存池部分,所有暂时可以看作是不重要的,等我们把内存池分析完成之后,我们在回过头来看这些代码。等我们把整个apache的数据结构掌握之后,这些代码的分析就会变的非常的简单和快速,而最开始的我们先从最简单的部分开始分析,所有下一次分析中,我们开始着手进行内存池的分析,这个是apr库的基础,也是整个apache的基础。下一次,我将带来对内存池的分析,敬请大家期待。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21120473/viewspace-660022/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/21120473/viewspace-660022/