工作中少不了要提取规则文件(如:日志文件/配置文件)行或行里字段信息,前一段时间在研究某应用程序源码时,发现其对
配置文件信息的提取方法很巧妙,后来工作上需要与同事之间交互信息,刚好通过日志来实现,日志的格式也是本人制定,提到
的这个方法也就用上了;
就拿最简单的配置文件来说,至少包含两部分信息:一是有用的注释,二是参数和参数设定值;
注释一般以#开头,整行都是解释信息,在读取时若是行首字节是#,则该行信息直接忽略,读取下一行;
参数和参数值的行一般参数字段定格书写,两者之间通过空格隔断;
如下示例:
# This is a test file.
cnt 1000
现在需要提取文件中cnt的设定值,方法很简单,只需要打开该文件,然后按行读取文件信息,先判断行首字节是否#,若是#则继续
读取下一行文件内容,若不是则比较该行的第一个字段是否为cnt,若是则提取该行的第二个字段就是cnt参数的设定值;
上面提到的是最基本的应用,实际任务中,阅读过源代码的都了解配置文件,每个配置文件有许多参数,这些参数的设定值开发者可以
自行设定,那么问题来了,这些设定的参数值,软件在启动时是怎样提取到的呢?方法就是上面的延伸了,将读取到的参数信息转换成链表
形式进行存储,每个节点包含成员有:参数名(char name[255]),参数值(int parameter),指针struct xxx *next,这样配置文件里面的参数
就存储到了内存的链表中,然后就可以通过提取链表中的值对内部参数赋值;到这一步应该已经没什么大问题了,但是结合最近了解的新知识
要是配置文件参数数量很多,形成的链表就会很长,查询起来将会消耗大量性能,对于这个问题,如果了解哈希链表的同学就会想到办法,这里
不多说,等研究透彻了在另外一篇博文中会提到,网上也有大量资源可查,将了这么多,看下上述中最简单方法的实现:
#include<stdio.h>
#include<string.h>
#include<fcntl.h>
#include<unistd.h>
#include&l