java-selinum爬虫

最新推荐文章于 2024-07-27 22:15:26 发布

雪寂霜凝

最新推荐文章于 2024-07-27 22:15:26 发布

阅读量249

点赞数

分类专栏： java 爬虫

本文链接：https://blog.csdn.net/duanaibing3017/article/details/113771719

版权

java 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

爬虫

1 篇文章 0 订阅

订阅专栏

本文章是介绍如何通过java语言使用selinum进行数据爬取。

首先项目需要依赖

        <dependency>
            <groupId>org.seleniumhq.selenium</groupId>
            <artifactId>selenium-java</artifactId>
            <version>4.0.0-alpha-1</version>
        </dependency>

我所用的chromedriver.exe版本是 89.0.4389.23

可自行去http://npm.taobao.org/mirrors/chromedriver/ 镜像库获取

最简单的一个实例：

public static void main(String[] args) throws InterruptedException {
        // 获取驱动程序路径，我放在resources文件夹下面的
        URL driverPath = ResourceUtil.getResource("chromedriver.exe");
        System.setProperty("webdriver.chrome.driver", driverPath.getPath());
        ChromeDriver webDriver = new ChromeDriver();
        String url = "http://www.baidu.com";
        webDriver.get(url);
        Thread.sleep(100);
        //打印网页源码
        System.out.println(webDriver.getPageSource());
        //获取网页title
        String title = webDriver.getTitle();
        //打印网页标题
        System.out.println(title);
    }