最近遇到的问题是,在连接到爬取页面后,因为有权限问题,所以是先post用户名、密码,然后再用get方法循环访问页面。问题就出来了。。。。
这破网站,每次开启一个页面,都会在服务器端打开个excel进程,
而由于我在程序上没有关闭页面,所以致使服务器已经不能响应请求了。。。。
此处的关闭页面,不等同于关闭连接。因为还需要保留访问网站的用户名、密码,
只需要在访问页面的代码中加一句:
httpclient.clearResponseInterceptors();
注意,此处我用的httpclient是DefaultHttpClient!