python 访问网页aspx_如何用python抓取aspx页面

最新推荐文章于 2023-06-27 09:27:25 发布

s.xie

最新推荐文章于 2023-06-27 09:27:25 发布

阅读量1k

点赞数

文章标签： python 访问网页aspx

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29943753/article/details/113966659

版权

我正在尝试抓取一个站点，https://www.searchiqs.com/nybro/(您必须单击“以来宾身份登录”才能进入搜索表单。如果我搜索一个party1术语，比如说“Andrew”，结果会有分页，而且请求类型是POST，这样URL不会改变，会话也会很快超时。如此之快，如果我等待10分钟刷新搜索url页面，它会给我一个超时错误。在

我最近开始抓取，所以我大部分时间都在做一些可以破译网址的帖子。到目前为止，我已经意识到我将不得不看看DOM。使用Chrome工具，我找到了标题。从Network选项卡中，我还发现了以下作为从搜索页面传递到结果页面的表单数据__EVENTTARGET:

__EVENTARGUMENT:

__LASTFOCUS:

__VIEWSTATE:/wEPaA8FDzhkM2IyZjUwNzg...(i have truncated this for length)

__VIEWSTATEGENERATOR:F92D01D0

__EVENTVALIDATION:/wEdAJ8BsTLFDUkTVU3pxZz92BxwMddqUSAXqb... (i have truncated this for length)

BrowserWidth:1243

BrowserHeight:705

ctl00$ContentPlaceHolder1$scrollPos:0

ctl00$ContentPlaceHolder1$txtName:david

ctl00$ContentPlaceHolder1$chkIgnorePartyType:on

ctl00$ContentPlaceHolder1$txtFromDate:

ctl00$ContentPlaceHolder1$txtThruDate:

ctl00$ContentPlaceHolder1$cboDocGroup:(ALL)

ctl00$ContentPlaceHolder1$cboDocType:(ALL)

ctl00$ContentPlaceHolder1$cboTown:(ALL)

ctl00$ContentPlaceHolder1$txtPinNum:

ctl00$ContentPlaceHolder1$txtBook:

ctl00$ContentPlaceHolder1$txtPage:

ctl00$ContentPlaceHolder1$txtUDFNum:

ctl00$ContentPlaceHolder1$txtCaseNum:

ctl00$ContentPlaceHolder1$cmdSearch:Search

所有戴帽子的都藏起来了。我还设法弄清楚了结果结构。在

我的剧本到目前为止真的很可怜，因为我完全不知道下一步该怎么做。我仍然要做表单提交，分析分页和结果，但我完全不知道如何继续。在

^{pr2}$

任何帮助都将不胜感激

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 访问网页aspx_如何用python抓取aspx页面

我正在尝试抓取一个站点，https://www.searchiqs.com/nybro/(您必须单击“以来宾身份登录”才能进入搜索表单。如果我搜索一个party1术语，比如说“Andrew”，结果会有分页，而且请求类型是POST，这样URL不会改变，会话也会很快超时。如此之快，如果我等待10分钟刷新搜索url页面，它会给我一个超时错误。在我最近开始抓取，所以我大部分时间都在做一些可以破译网址的帖子...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。