python解析html table,如何使用Python解析带有表格的HTML文件

我有一个带有表格的HTML文件(它是一个大的文件,所以只给出示例代码)。我想检索表中的值。我尝试了python的HTMLParser库。如何使用Python解析带有表格的HTML文件

我开始编码如下。然后我发现属性“class”与系统定义的关键字相同。所以它给了我错误。为表

STATION CODESTATION NAMESCHEDULED ARRIVALSCHEDULED DEPARTUREACTUAL/ EXPECTED ARRIVALACTUAL/ EXPECTED DEPARTURE
TVC ORIGONStarting Station 05:00, 07 May 2011Starting Station05:00, 07 May 2011
TVP NEY YORK05:04, 07 May 201105:05, 07 May 201105:04, 07 May 201105:05, 07 May 2011

UPDATE

class MyHTMLParser(HTMLParser):

def handle_starttag(self, tag, attrs):

if tag == 'tr':

for class in attrs:

if class == 'Table_row'

p = MyHTMLParser()

p.feed(ht)

HTML代码

我怎么能得到标记之间的数据?

+0

我写了一个小而简单的HTML解析器表不需要任何外部模块:https://github.com/schmijos/html-table-parser-python3/blob/master/html_table_parser/parser.py –

2014-12-09 09:42:36

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值