解析文件.Win32 用户: 创建一个用来解析 Windows .ini 文件的程序. POSIX 用户:创建一个解析 /etc/serves 文件的程序. 其它平台用户: 写一个解析特定结构的系统配置文件的程序.
网上的例子多是解析 windows 的win.ini 的,这个相对简单些。
这里是解析/etc/services的,由于某些列(各列可以看做配置项)可能为空,需要对怎么取出各列和判断可能为空的列做些处理。
用dict存储解析结果:
dict的每个key的名字就是该行的第一列(服务名),这个key的value就是该行其他元素组成的list,且list的每个元素以 配置项名称 = 配置项值 的形式出现。
# coding:utf-8
import re
# 把文件读取进来, 每行存放到list, 不断增加list元素, 注释行忽略
def file_analyze(fname):
line_list = list()
with open(fname, ‘r‘) as fd:
for eachline in fd:
if eachline.startswith(‘#‘):
continue
line_list.append(eachline)
return line_list
# 用一个dict存放解析结果, dict的每个元素是一个list, dict的每个key-value对是每行的解析结果
# 怎么区分每列呢?第一二列区分方法用空格
# 第四列用#分割出来就行
# 第三四列的区分方法是把每行去掉第四列后, 再去掉第一列和第二列
# 其中需要对第三列和第四列可能为空的情况做判断
# item就是文件的每行
def column_analyze(file_list):
for item in file_list:
line_analyze_list = list()
service_name, tmp_port_protocol, port_protocol, aliases, comment = str(), str(), str(), str(), str()
if len(item.strip(‘\n‘).strip(‘\s‘)) == 0:
continue
for unit in re.split(‘//s+‘, item):
service_name = unit.split()[0]
tmp_port_protocol = unit.split()[1].strip()
port_protocol = ‘port_protocol = ‘ + unit.split()[1].strip()
line_analyze_list.append(port_protocol)
tmp_aliases = unit.split(‘#‘)[0].strip(service_name).lstrip(). strip(tmp_port_protocol)
if len(tmp_aliases.strip()) == 0:
aliases = ‘aliases = ‘
else:
aliases = ‘aliases = ‘ + unit.split(‘#‘)[0]. strip(service_name). lstrip().strip(tmp_port_protocol).strip()
line_analyze_list.append(aliases)
if unit.find(‘#‘) < 0:
comment = ‘comment = ‘
else:
comment = ‘comment = ‘ + unit.split(‘#‘)[1].strip().strip(‘\n‘)
line_analyze_list.append(comment)
analyze_dict[service_name] = line_analyze_list
return analyze_dict
def main(fname, listname):
listname = file_analyze(fname)
analyze_dict = column_analyze(listname)
if __name__ == ‘__main__‘:
analyze_list = list()
analyze_dict = dict()
file_name = ‘/etc/services‘
main(file_name, analyze_list)
print analyze_dict
原文地址:http://khaozi.blog.51cto.com/952782/1896307