java+webMagic+selenium

1、引入相关包 

       <!-- WebMagic -->
        <dependency>
            <groupId>us.codecraft</groupId>
            <artifactId>webmagic-core</artifactId>
            <version>${webmagic.version}</version>
        </dependency>
        <dependency>
            <groupId>us.codecraft</groupId>
            <artifactId>webmagic-extension</artifactId>
            <version>${webmagic.version}</version>
        </dependency>
        
        <!-- selenium本身是一种自动化测试工具 -->

         <dependency>
            <groupId>us.codecraft</groupId>
            <artifactId>webmagic-selenium</artifactId>
            <version>${webmagic.version}</version>
        </dependency>
        <!-- selenium需要依赖的包,不能少 -->
        <dependency>
            <groupId>com.google.guava</groupId>
            <artifactId>guava</artifactId>
            <version>25.0-jre</version>
        </dependency>

2、我使用的chrome浏览器,版本 78.0.3904.70

驱动下载地址(驱动的版本与浏览器版本要严格一致):http://npm.taobao.org/mirrors/chromedriver/

(windows-32位的)

下载驱动后,将驱动所在的目录路径放入windows的环境变量path中去。

然后就可以测试了:

public class SeleniumTest {
	public static void main(String[] args) {
        // 第一步: 设置chromedriver地址。一定要指定驱动的位置。
        System.setProperty("webdriver.chrome.driver",
        		"C://xxx//misjey//chromedriver_win32//78.0.3904.70_win32//chromedriver.exe");
        // 第二步:初始化驱动
        WebDriver driver = new ChromeDriver();
        // 第三步:获取目标网页
        driver.get("http://blog.csdn.net/wgyscsf/article/details/52835845");
        // 第四步:解析。以下就可以进行解了。使用webMagic、jsoup等进行必要的解析。
        System.out.println("Page title is: " + driver.getTitle());
        System.out.println("Page title is: " + driver.getPageSource());
    }
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值