html 中th怎么隐藏,如何在解析html表时忽略th标签？

最新推荐文章于 2023-02-18 19:45:22 发布

weixin_39850331

最新推荐文章于 2023-02-18 19:45:22 发布

阅读量1.8k

点赞数

文章标签： html 中th怎么隐藏

你好，我是相当新的解析与python和beautifulsoup4的HTML表。所有的进展都很顺利，直到我碰到这个奇怪的表格，它在表格中间使用'th'标签，导致我的语法分析结束并抛出'索引超出范围'的错误。我试过搜索和谷歌无济于事。问题是如何在解析表时忽略或剥离这个流氓'th'标签？如何在解析html表时忽略th标签？

这里是我的代码至今：

from mechanize import Browser

from bs4 import BeautifulSoup

mech = Browser()

url = 'https://www.moscone.com/site/do/event/list'

page = mech.open(url)

html = page.read()

soup = BeautifulSoup(html)

table = soup.find('table', { 'id' : 'list' })

for row in table.findAll('tr')[3:]:

col = row.findAll('td')

date = col[0].string

name = col[1].string

location = col[2].string

record = (name, date, location)

final = ','.join(record)

print(final)

这是导致我的错误的HTML的一个小片段

Convention

Mon Dec 01 00:00:00 PST 2014

12/06/14 - 12/09/14

我想上面这流氓'下面的数据th'表示在桌上的新月开始

2014-11-02

Chilly

weixin_39850331

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
html 中th怎么隐藏,如何在解析html表时忽略th标签？

你好，我是相当新的解析与python和beautifulsoup4的HTML表。所有的进展都很顺利，直到我碰到这个奇怪的表格，它在表格中间使用'th'标签，导致我的语法分析结束并抛出'索引超出范围'的错误。我试过搜索和谷歌无济于事。问题是如何在解析表时忽略或剥离这个流氓'th'标签？如何在解析html表时忽略th标签？这里是我的代码至今：from mechanize import Browserf...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。