用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack()函数来分页,这样就不能直接看到目标网页的参数和地址。
我们可以通过HttpWatch、ieHTTPHeaders、等工具来分析 HTTP 头,从而获取POST数据,找出规律,看看那个是分页参数,一般类似这样的值“__EVENTTARGET=DataGrid3%3A_ctl24% 3A_ctl1”这部分里就有,最后1 就是页号。只是例子。
然后自己写程序POST方式访问此页面,并把这些数据完整的当做POST数据传给这个页面,同时修改分页参数,就可以获取全部网页的数据了。 大概就这思路,你在琢磨琢磨。
YulinCMS(雨林内容管理系统) 是采用微软的.net技术进行架构、功能强大的网站管理软件。用户不需要学习复杂的建站技术,不需要学习太复杂的HTML语言,你就能够利用YulinCMS构建出一个风格统一功能强大的专业网站,大大加快网站的建设周期。
[原创]用TOPFISHER采集用__doPostBack()分页的网站数据
用ASP.NET开发的网站经常会用JAVASCRIPT脚本,以__doPostBack
()函数来分页,这样就不能直接看到目标网页的参数和地址。下面我来教大家用TOPFISHER页面辅助分析器,结合TOPFISHER来采集__doPostBack
()式分页的页面。
以http://www.ynnw.gov.cn/scxx/schq.aspx这个页面为例:
1.先用TOPFISHER页面辅助分析器打开http://www.ynnw.gov.cn/scxx/schq.aspx;
2.在分析器内的WEB窗口,点击分页中的任意一页;
3.这时候可以看到POST数据窗口中出现了一大堆POST数据;(这些数据就是schq.aspx接收的POST参数,这里我们只需要关注参数中的“__EVENTTARGET=DataGrid3%3A_ctl24%3A_ctl1”这部分,其中的红色部分,其实就是页面的页数)
4.在TOPFISHER脚本中,用PostUrl()函数,来访问这个页面,并把这些数据完整的当做POST数据传给这个页面,然后再用FOR语句,来修改页面参数,就可以完成全部采集了。
http://www.topfisher.com/doc/TPAssistant.rar
c#抓取浏览器网页代码数据(winform)
http://www.cnblogs.com/fhmsha/archive/2007/07/18/822034.html
转载于:https://www.cnblogs.com/smallfa/archive/2008/01/18/1044476.html