最近在爬取一些网站获取少量数据,但是发现这个网站并不能用平常的构造表单来post,请大家帮忙看看啊
网站链接:所爬取的网站链接 其实主要是想获取以下的两个参数来构造表单进行翻页:
function __doPostBack(eventTarget, eventArgument) {
if (window.navigator.appName.toLowerCase().indexOf(“microsoft”) > -1) {
theform = document.Form1;
}
else {
theform = document.forms[“Form1”];
}
theform.__EVENTTARGET.value = eventTarget.split("$").join("?;
theform.__EVENTARGUMENT.value = eventArgument;
theform.submit();
__EVENTTARGET ?
__EVENTARGUMENT ? 我搜索到了以下答案,但进行了尝试发现并不能进行翻页:
#只需要不断循环以下代码就可以了不断翻页得到数据
for i in range(1, 112):
params = {
‘__VIEWSTATE’: soup.find(id="__VIEWSTATE")[‘value’],
‘__VIEWSTATEGENERATOR’: ‘01EFB7A5’,
‘__EVENTTARGET’: ‘moreinfo_search_fl1$Pager’,
‘__EVENTARGUMENT’: str(i),
'__EVENTVALIDATION’: soup.find(id="__EVENTVALIDATION”)[‘value’] (Ps:该网站中并没有此参数)
}
循环后的params确实发生了变化,但是爬取到的内容仍然是第一页的内容,这让我很是苦恼!
求各位大神答疑解惑!!!!!