pandas读取html页面中的表格数据

说明:直接调用pands中的pd.read_html(url)函数,如果页面中有表格,那么表格数据会以DataFrame格式存储下来。

比如我要获取下面的数据:

调用代码:

import pandas as pd
pd.set_option('display.width',1000)
pd.set_option('display.max_row',1000)
pd.set_option('display.max_column',1000)

html=pd.read_html('http://www.hbzwfw.gov.cn/art/2019/11/28/art_21290_7313.html')
print(html[1])

取出表格的数据是这样的:

这样就省去了用爬虫爬去再去筛选td/tr标签了,还是比较方便的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值