解析文件. Win32 用户: 创建一个用来解析 Windows .ini 文件的程序. POSIX 用户:创建一个解析 /etc/serves 文件的程序. 其它平台用户: 写一个解析特定结构的系统配置文件的程序.


网上的例子多是解析 windows 的win.ini 的,这个相对简单些。


这里是解析/etc/services的,由于某些列(各列可以看做配置项)可能为空,需要对怎么取出各列和判断可能为空的列做些处理。


用dict存储解析结果:

dict的每个key的名字就是该行的第一列(服务名),这个key的value就是该行其他元素组成的list,且list的每个元素以 配置项名称  =  配置项值 的形式出现。


# coding:utf-8

import re

# 把文件读取进来, 每行存放到list, 不断增加list元素, 注释行忽略


def file_analyze(fname):
    line_list = list()
    with open(fname, 'r') as fd:
        for eachline in fd:
            if eachline.startswith('#'):
                continue
            line_list.append(eachline)
    return line_list


# 用一个dict存放解析结果, dict的每个元素是一个list, dict的每个key-value对是每行的解析结果
# 怎么区分每列呢?第一二列区分方法用空格
# 第四列用#分割出来就行
# 第三四列的区分方法是把每行去掉第四列后, 再去掉第一列和第二列
# 其中需要对第三列和第四列可能为空的情况做判断

# item就是文件的每行

def column_analyze(file_list):
    for item in file_list:
        line_analyze_list = list()
        service_name, tmp_port_protocol, port_protocol, aliases, comment = \
            str(), str(), str(), str(), str()
        if len(item.strip('\n').strip('\s')) == 0:
            continue
        for unit in re.split('//s+', item):
            service_name = unit.split()[0]
            tmp_port_protocol = unit.split()[1].strip()
            port_protocol = 'port_protocol = ' + unit.split()[1].strip()
            line_analyze_list.append(port_protocol)
            tmp_aliases = unit.split('#')[0].strip(service_name).lstrip().\
                strip(tmp_port_protocol)
            if len(tmp_aliases.strip()) == 0:
                aliases = 'aliases = '
            else:
                aliases = 'aliases = ' + unit.split('#')[0].\
                    strip(service_name).\
                    lstrip().strip(tmp_port_protocol).strip()
            line_analyze_list.append(aliases)
            if unit.find('#') < 0:
                comment = 'comment = '
            else:
                comment = 'comment = ' + unit.split('#')[1].strip().strip('\n')
            line_analyze_list.append(comment)
            analyze_dict[service_name] = line_analyze_list
    return analyze_dict


def main(fname, listname):
    listname = file_analyze(fname)
    analyze_dict = column_analyze(listname)


if __name__ == '__main__':
    analyze_list = list()
    analyze_dict = dict()
    file_name = '/etc/services'
    main(file_name, analyze_list)
    print analyze_dict