前言
项目交付需要提交文档,其中要求提供测试用例的文档,但是TestLink只能导出为xml格式(ps,可能是我们公司的testlink太老-_-),不可能直接交付一个xml格式文件给领导吧。2000多条用例也不可能手工改写。最后求助python脚本,使用脚本来转换格式。
需求分析
- 需要解析xml格式文件
- 存为Excel格式文件
- Testlink导出的xml文件对多段文字、特殊符号使用了html格式转义,需要反向解析
准备
- 安装python3.6
- 安装xlwt模块用于写入Excel文件
行动
1.解析html文件,使用python包html.parser.HTMLParser
从导出来的xml文件中发现步骤的字符串是如下格式
<p> zzzzz。</p>
<p>yyyy;</p>
<div>xxxxxx。 </div>
<div> </div>
<p>yyyy;</p>
<div>xxxxxx。 </div>
<div> </div>
我们期望。转化为
zzzzz。
yyyy;
xxxxxx。
粗略分析,testlink导出的多段文字、特殊符号只使用了标签和html转义字符,所以代码如下