在乙方使用天镜进行众多漏洞扫描,其默认导出格式为HTML,因为工作需要将其发现漏洞全部贴到Excel表格中,动不动就是成百上千的漏洞,任务量吓人。于是写一脚本,减少工作量。
Code:
# -*- coding: utf-8 -*-
# ******************************************************
# Author : Nt
# Last modified: 2016-12-16 16:39
# Email : huai201208@gmail.com
# Filename : html2excel.py
# Version : 1.0
# Description : 方便导出天镜漏洞报告中的漏洞列表。
# Example : html2excel.py /Report/files/Report_main.html outFileName.xls
# ******************************************************
import re
import sys
import xlwt
from bs4 import BeautifulSoup
excelTXT = [] # 存放所有的excel待写入内容
vbName = '' # 漏洞名字
vbType = '' # 漏洞类型
vbLevel = '' # 危险级别
vbCVE = '' # CVE编号
vbIP = '' # 主机IP
vbDesc = '' # 详细描述
vbRepair = '' # 修复建议
exp1 = re.compile("(?isu)<tr[^>]*>(.*?)</tr>") # 正则寻找tr标签
exp2 = re.compile("(?isu)<div[^>]*>(.*?)</div>") # 正则寻找div标签
exp3 = re.compile("(?isu)<a[^>]*>(.*?)</a>") # 正则寻找a标签,因为CVE是a标签.比较特殊
htmlSource = open(sys.argv[1]).read() # 读入html文件,天镜目录为: files/Report_main.html
soup = BeautifulSoup(htmlSource,