Python BeautifulSoup 解析html log文件

背景:根据项目需求,有一些html 格式的log,需要对其进行解析,抓取需要的数据,并放进去excel里面方便进行分析

html 图显示如下图,部分截图

 

用notepad++打开 html 的JavaScript格式(部分代码)如下:

<table cellspacing="0"><tr><td><UL>
<b>Additional Test Run Data</b><UL CLASS="tob"><LI CLASS="close" ONMOUSEOVER="over(event);" ONMOUSEOUT="out(event);" ONCLICK="showIt(event);">
<span>Test Time...</span><UL>
<LI>Start Time:  17:35:07</LI>
<LI>Stop Time:  17:37:52</LI>
<LI>Duration:  00:02:45  174ms</LI>
</UL>
</LI></UL>
<UL CLASS="tob"><LI CLASS="close" ONMOUSEOVER="over(event);" ONMOUSEOUT="out(event);" ONCLICK="showIt(event);">
<span>DUT Information...</span><UL>
<LI>DUT ID:  48F3F32D8AA6</LI>
<LI>Name:  DuPods Pro-73F</LI>
</UL>
</LI></UL>
<UL CLASS="tob"><LI CLASS="close" ONMOUSEOVER="over(event);" ONMOUSEOUT="out(event);" ONCLICK="showIt(event);">
<span>Script Information...</span><UL>
<LI>Name:  script#3</LI>
<LI>File Path:  C:/itc/Bluetooth/paraCfg/lastPara.dat</LI>
</UL>
</LI></UL>
<UL CLASS="tob"><LI CLASS="close" ONMOUSEOVER="over(event);" ONMOUSEOUT="out(event);" ONCLICK="showIt(event);">
<span>Test Station Information...</span><UL>
<LI>Name:  Bluetooth Test Set</LI>
<LI>Model:  ITC-RT550</LI>
<LI>SN:  186351</LI>
</UL>
</LI></UL>
</UL></td></tr></table>

<table border="1" width="80%" cellspacing="0" style="table-layout:fixed;">
<tr>
<td bgcolor="#FFFFCC" align="center"><b>Output Power</b></td>
<td bgcolor="#FFFFCC" align="center"><b>Limits</b></td>
<td bgcolor="#6699CC" align="center"><b> Summary </b></td>
</tr>
<tr>
<td align="center">Avg Max Txp</td>
<td align="center">(-6 dBm, 20 dBm)</td>
<td align="center">10.74 dBm</td>
</tr>
<tr>
<td align="center">Avg Min Txp</td>
<td align="center">(-6 dBm, 20 dBm)</td>
<td align="center">7.3 dBm</td>
</tr>
<tr>
<td align="center">Avg Txp</td>
<td align="center">(-6 dBm, 20 dBm)</td>
<td align="center">9.07 dBm</td>
</tr>
<tr>
<td align="center">Peak Txp</td>
<td align="center">&lt; 23 dBm</td>
<td align="center">11.09 dBm</td>
</tr>
<tr>
<td align="center">Result</td>
<td align="center"> --/-- </td>
<td align="center">Pass</td>
</tr>
</table>

 如上,此html是html的一些table以及tr td来表示的。通过BeautifulSoup的一些find_all的函数,来获取所有table tr以及td 

from bs4 import BeautifulSoup

htmlfile = open(filepath, 'r')
htmlhandle = htmlfile.read()
soup = BeautifulSoup(htmlhandle, "lxml")
for table in soup.find_all('table'):
    for tr in table.find_all('tr'):
        for td in tr.find_all('td')
            print(td.text)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值