selenium+ChromeDriver+java爬虫初探
selenium
自动化测试工具,可以完全模拟人的行为。我们可以用它来打开浏览器,访问指定URL,并且定位到具体的按钮,点击触发事件等等。
ChromeDriver
selenium和谷歌浏览器交互,需要这个驱动。下载地址(http://npm.taobao.org/mirrors/chromedriver/)。版本和谷歌浏览器的版本要一致,或者相差不多也行。
简单的demo
System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
ChromeDriver webDriver=new ChromeDriver();
webDriver.get("https://www.baidu.com");
WebElement elementByCssSelector = webDriver.findElementByCssSelector("#kw");
elementByCssSelector.sendKeys("java语言");
webDriver.findElementById("su").click();
for (int i = 0; i <10 ; i++) {
TimeUnit.SECONDS.sleep(5);
List<WebElement> elements = webDriver.findElementById("page").findElement(By.className("page-inner")).findElements(By.className("n"));
if(elements.size()>1){
elements.get(1).click();
}else{
elements.get(0).click();
}
}