ChromeWebDriver 完整爬到页面的逻辑内容
/*配置基础选项*/
ChromeOptions options = new ChromeOptions();
/*配置页面加载策略 */
options.setPageLoadStrategy(PageLoadStrategy.EAGER);
/*设置无头模式*/
options.addArguments("-headless");
/*创建驱动*/
ChromeDriver webDriver = new ChromeDriver(options);
/*设置页面超时时间配置*/
WebDriver.Timeouts timeouts = webDriver.manage().timeouts();
timeouts.pageLoadTimeout(20, TimeUnit.SECONDS);
/*获取页面*/
webDriver.get("https://www.cnblogs.com/dk1024/p/11590510.html");
/*获取页面元素*/
WebElement webElement = webDriver.findElement(By.xpath("/html"));
/*获取页面内容*/
String content = webElement.getAttribute("outerHTML");
/*完整页面html*/
Html html = new Html(content);