python解析html table,如何使用Python解析带有表格的HTML文件

最新推荐文章于 2024-05-09 15:09:33 发布

某miao

最新推荐文章于 2024-05-09 15:09:33 发布

阅读量881

点赞数

文章标签： python解析html table

我有一个带有表格的HTML文件(它是一个大的文件，所以只给出示例代码)。我想检索表中的值。我尝试了python的HTMLParser库。如何使用Python解析带有表格的HTML文件

我开始编码如下。然后我发现属性“class”与系统定义的关键字相同。所以它给了我错误。为表

STATION CODE	STATION NAME	SCHEDULED ARRIVAL	SCHEDULED DEPARTURE	ACTUAL/ EXPECTED ARRIVAL	ACTUAL/ EXPECTED DEPARTURE
TVC	ORIGON	Starting Station	05:00, 07 May 2011	Starting Station	05:00, 07 May 2011
TVP	NEY YORK	05:04, 07 May 2011	05:05, 07 May 2011	05:04, 07 May 2011	05:05, 07 May 2011

UPDATE

class MyHTMLParser(HTMLParser):

def handle_starttag(self, tag, attrs):

if tag == 'tr':

for class in attrs:

if class == 'Table_row'

p = MyHTMLParser()

p.feed(ht)

HTML代码

我怎么能得到标记之间的数据？

+0

我写了一个小而简单的HTML解析器表不需要任何外部模块：https://github.com/schmijos/html-table-parser-python3/blob/master/html_table_parser/parser.py –

2014-12-09 09:42:36

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python解析html table,如何使用Python解析带有表格的HTML文件

我有一个带有表格的HTML文件(它是一个大的文件，所以只给出示例代码)。我想检索表中的值。我尝试了python的HTMLParser库。如何使用Python解析带有表格的HTML文件我开始编码如下。然后我发现属性“class”与系统定义的关键字相同。所以它给了我错误。为表STATION CODESTATION NAMESCHEDULED ARRIVALSCHEDULED DEPARTUREACTU...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。