python获取html的tr,使用lxm获取python中tr tbody中的所有td内容

最新推荐文章于 2022-12-05 21:04:13 发布

晓荼

最新推荐文章于 2022-12-05 21:04:13 发布

阅读量2.6k

点赞数 2

文章标签： python获取html的tr

这将从ajax请求中获取json格式的数据：import requests

headers = {

'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36',

'Content-Type': 'application/json',

'Referer': 'http://droughtmonitor.unl.edu/MapsAndData/DataTables.aspx',

'X-Requested-With': 'XMLHttpRequest',

}

import json

data = json.dumps({'area':'conus', 'type':'conus', 'statstype':'1'})

ajax = requests.post("http://droughtmonitor.unl.edu/Ajax.aspx/ReturnTabularDM",

data=data,

headers=headers)

from pprint import pprint as pp

pp(ajax.json())

输出片段：

^{pr2}$

您可以从返回的json中获取所需的所有数据，如果您print(len(cont.json()["d"]))您将看到返回的853行，因此您似乎可以一次性从35页中获取所有数据。即使你确实解析了这个页面，你仍然需要再做34次，从ajax请求中获取json使得解析变得很容易，而且都是从一个post中获得的。在

要按状态过滤，我们需要将type设置为state，并将{}设置为CA：data = json.dumps({'type':'state', 'statstype':'1','area':'CA'})

ajax = requests.post("http://droughtmonitor.unl.edu/Ajax.aspx/ReturnTabularDM",

data=data,

headers=headers)

from pprint import pprint as pp

pp(ajax.json())

又是一个简短的片段：{u'd': [{u'D0': 95.73,

u'D1': 89.68,

u'D2': 74.37,

u'D3': 49.15,

u'D4': 21.04,

u'Date': u'2016-05-03',

u'FileDate': u'20160503',

u'None': 4.27,

u'ReleaseID': 890,

u'__type': u'DroughtMonitorData.DmData'},

{u'D0': 95.76,

u'D1': 90.09,

u'D2': 74.37,

u'D3': 49.15,

u'D4': 21.04,

u'Date': u'2016-04-26',

u'FileDate': u'20160426',

u'None': 4.24,

u'ReleaseID': 889,

u'__type': u'DroughtMonitorData.DmData'},

您将看到与页面上显示的内容相匹配的内容。在

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。