在爬取网站数据时,总是出现浏览器已经停止而IDE还在后台运行的情况。
之前这种情况也有,不过通常是在已经抓了几百页数据之后才出现。
我记得昨天爬数据时可以一直爬到好几十页,后来我嫌慢,就注释了每次点击后的暂停两秒(我百度了一下发现这种行为很不道德),结果浏览器爬第一条数据浏览器就死掉了。后来我又在每条.click()代码后面设置暂停5秒,还是于事无补。
多次测试后我发现,IDE始终停留在这条代码:
String pageSource = driver.getPageSource();
最后查看了selenium和firefox的版本,原来是版本对应问题 —.—!