Selenium安装以及案例演示【Java爬虫】

天蝎座的程序媛

已于 2023-06-29 11:07:15 修改

阅读量7.1k

点赞数 90

分类专栏：前沿技术+Shiro权限框架文章标签：爬虫开发语言 java selenium

于 2022-11-15 11:15:56 首次发布

本文链接：https://blog.csdn.net/m0_62246061/article/details/127861228

版权

前沿技术+Shiro权限框架专栏收录该内容

9 篇文章 4 订阅

订阅专栏

一、Selenium简介

Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。适用于自动化测试，js动态爬虫（破解反爬虫）等领域。

安装的详细过程可以参考这篇文章！！！

Selenium 的安装和基本使用_小小明-代码实体的博客-CSDN博客

二、Selenium组成

1）Selenium IDE：嵌入到Firefox浏览器中的一个插件，实现简单的浏览器操作录制与回放功能，主要用于快速创建BUG及重现脚本，可转化为多种语言

2）Selenium RC：核心组件，支持多种不同语言编写自动化测试脚本，通过其服务器作为代理服务器去访问应用，达到测试的目的

3）Selenium WebDriver（重点）：一个浏览器自动化框架，它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言，如Java、C# 、PHP、Python、Perl、Ruby

4）Selenium grid：测试辅助工具，用于做分布式测试，可以并行执行多个测试任务，提升测试效率。

三、Selenium特点

1）开源、免费
2）多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
3）多平台支持:Linux、Windows、MAC;
4）多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
5）对Web页面有良好的支持；
6）简单(API 简单)、灵活(用开发语言驱动);
7）支持分布式测试用例执行。

四、案例演示

爬虫：数据采集、数据清晰、数据分析！！！

4.1 java爬虫入门

下载驱动包
http://chromedriver.storage.googleapis.com/index.html

创建项目并导入依赖

    <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-java</artifactId>
        <version>3.141.59</version>
     </dependency>

入门

    //设置驱动
     System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
     //创建驱动
     WebDriver driver=new ChromeDriver();
     //与将要爬取的网站建立连接
     driver.get("https://www.baidu.com");
     //关闭浏览器
     driver.close();
     //释放资源
     driver.quit();

4.2 相关API

1.元素选择方式

1）Class选择：driver.findElement(By.className("s_ipt"));
2）ID选择： driver.findElement(By.id("kw"));
3）name选择： driver.findElement(By.name("wd"));
4）tag选择： driver.findElements(By.tagName("input"));
5）link选择： driver.findElement(By.linkText("地图"));
6）Partial link选择（a标签文本内容模糊匹配）：driver.findElement(By.partialLinkText("使用百"));
7）css选择器：driver.findElement(By.cssSelector("#kw"));
8）xpath选择：driver.findElement(By.xpath("//*[@id=\"kw\"]"));

2.获取单个元素：driver.findElement

3.获取多个元素：driver.findElements

4.输入内容：input.sendKeys("java");

5.元素点击：element.click();

6.获取元素属性：nextPageEle.getAttribute("class")

7.获取标签文本内容：titleEle.getText()

package com.zking;

import org.openqa.selenium.By;
import org.openqa.selenium.WebDriver;
import org.openqa.selenium.chrome.ChromeDriver;

import java.util.List;

public class Demo {
    public static void main(String[] args) {
        //设置驱动
        System.setProperty("webdriver.chrome.driver", "D:\\app\\Administrator\\initPath\\chromedriver.exe");
        //创建驱动
        WebDriver driver = new ChromeDriver();
        //与将要爬取的网站建立连接
        driver.get("https://www.baidu.com");

//        1）Class选择：driver.findElement(By.className("s_ipt"));
//        WebElement element=driver.findElement(By.className("s_btn"));
//        System.out.println(element.getAttribute("value"));
//
//        2）ID选择：   driver.findElement(By.id("kw"));
//        WebElement element=driver.findElement(By.id("kw"));
//        System.out.println(element.getAttribute("class"));
//
//        3）name选择： driver.findElement(By.name("wd"));
//        WebElement element=driver.findElement(By.name("wd"));
//        System.out.println(element.getAttribute("maxlength"));
//
//        4）tag选择：  driver.findElements(By.tagName("input"));
//        List<WebElement> elements = driver.findElements(By.tagName("a"));
//        for (WebElement element:elements){
//            System.out.println(element.getText().trim());
//        }
//        5）link选择： driver.findElement(By.linkText("地图"));
//        WebElement elemen = driver.findElement(By.linkText("网盘"));
//        System.out.println(elemen.getText());
//        6）Partial link选择（a标签文本内容模糊匹配）：driver.findElement(By.partialLinkText("使用百"));
//        List<WebElement> elements = driver.findElements(By.partialLinkText("人"));
//        for (WebElement element:elements){
//            System.out.println(element.getText());
//        }
//        7）css选择器：driver.findElement(By.cssSelector("#kw"));
//        List<WebElement> elements = driver.findElements(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
//        for(WebElement element:elements){
//            System.out.println(element.getText());
//        }
//        8）xpath选择：driver.findElement(By.xpath("//*[@id=\"kw\"]"));
//        WebElement element = driver.findElement(By.xpath("//*[@id=\"kw\"]"));
//        System.out.println(element.getAttribute("value"));
//
//        driver.findElement(By.id("kw")).sendKeys("java");
//        driver.findElement(By.id("su")).click();
//    }
    }
}

以上就是今天的分享！！！

我的博客即将同步至腾讯云开发者社区，邀请大家一同入驻：https://cloud.tencent.com/developer/support-plan?invite_code=1y1pcwsaf33mn

天蝎座的程序媛

关注

90
点赞
踩
131

收藏

觉得还不错? 一键收藏
打赏
155
评论
Selenium安装以及案例演示【Java爬虫】

一、Selenium简介一、Selenium简介Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括IE（7, 8, 9, 10, 11），Mozilla Firefox，Safari，Google Chrome，Opera等。适用于自动化测试，js动态爬虫（破解反爬虫）等领域。
复制链接

扫一扫