selenium学习笔记


前言

在学习爬虫的时候,接触到了selenium,感觉很有趣,所以做些笔记方便后面使用。

一、环境

python 3.7
selenium 3.141.0

二、学习

1.安装

使用pip安装selenium

pip install selenium

使用selenium的时候需要对应浏览器的driver,我用的是谷歌浏览器,所以要下载谷歌浏览器的driver,我的driver已经放到了百度网盘https://pan.baidu.com/s/1KNtrd1lyUOCe323WtWS9Nw ,提取码:yxw8

2.使用

创建一个test.py来做各种测试,先使用selenium打开网站https://pic.netbian.com/4kmeinv/index.html
test.py:

from selenium import webdriver

# 实例化一个浏览器对象(传入浏览器驱动),executable_path指的是driver路径
web = webdriver.Chrome('./chromedriver.exe')

web.get('https://pic.netbian.com/4kmeinv/index.html')

你会看到打开一个新的浏览器端口,并且访问对应网站
在这里插入图片描述
要获取打开网页的源码可以通过下面代码进行:

print(web.page_source)

可以看到控制台输出了网页的html代码
在这里插入图片描述
selenium的强大之处在于,它能够模拟人对网页进行操作。下面的的代码将执行的操作:打开网页,定位到搜索框,往搜索框里面输入‘刘亦菲’,再定位到搜索按钮,点击搜索按钮,最后等待五秒之后,关闭浏览器

from selenium import webdriver
from time import sleep

# 实例化一个浏览器对象
web = webdriver.Chrome('./chromedriver.exe')

web.get('https://pic.netbian.com/4kmeinv/index.html')

# print(web.page_source)

# 获取搜索框对象
search_input = web.find_element_by_css_selector('.search p input')

# 往输入框输入内容
search_input.send_keys('刘亦菲')

# 获取搜索按钮对象
search_button = web.find_element_by_css_selector('.search .sub')

# 点击按钮
search_button.click()

# 休眠5秒
sleep(5)

# 关闭浏览器
web.close()

selenium如何定位页面元素,网上很多教程,这里就不多说了,就解释一下search_input = web.find_element_by_css_selector(‘.search p input’),这句代码吧。
在这里插入图片描述
find_element_by_css_selector顾名思义,根据css选择器查找页面元素。如上图,绿色框出来的是搜索框,因为它是包含在class为search的div里面,所以’.search’可以找到它的父元素,又因为搜索框是在’.search’下的p标签里面,所以完整写法web.find_element_by_css_selector(‘.search p input’)

来看看结果:
在这里插入图片描述

然而,在实际爬取数据的过程中,我们会爬取很多页面的数据,使用selenium的请求网页的时候每一个页面都会打开一个窗口,而且浏览器也会检测到正在被selenium控制。
但是不用担心,我们的前辈早就为我们解决了以上问题,添加如下代码即可

# 实现无可视化界面的操作
options = Options()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
# 实现规避检测
options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 实例化一个浏览器对象
web = webdriver.Chrome('./chromedriver.exe', options=options)

你会发现,再次使用selenium访问网站是不会新建浏览器端口了,也能打印对应的网页源码。

ps:附上完整代码
test.py

from selenium import webdriver
from time import sleep

# 实现无可视化界面的操作和规避检测
from selenium.webdriver.chrome.options import Options

# 实现无可视化界面的操作
options = Options()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
# 实现规避检测
options.add_experimental_option('excludeSwitches', ['enable-automation'])

# 实例化一个浏览器对象(传入浏览器驱动),executable_path指的是driver路径
web = webdriver.Chrome('./chromedriver.exe', options=options)

web.get('https://pic.netbian.com/4kmeinv/index.html')

print(web.page_source)

# 获取搜索框对象
search_input = web.find_element_by_css_selector('.search p input')

# 往输入框输入内容
search_input.send_keys('刘亦菲')

# 获取搜索按钮对象
search_button = web.find_element_by_css_selector('.search .sub')

# 点击按钮
search_button.click()

# 休眠5秒
sleep(5)

# 关闭浏览器
web.close()

有什么问题欢迎在评论区留言。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当然,我可以帮你输出一篇Selenium学习笔记。以下是一份简单的学习笔记供参考: Selenium学习笔记 Selenium是一款用于自动化Web应用程序测试的强大工具。它提供了一组丰富的API,可以与各种编程语言(如Python、Java、C#等)结合使用,以实现Web应用程序的自动化测试。 1. 安装和配置 首先,你需要安装Selenium库。如果你使用Python,可以使用以下命令安装: ``` pip install selenium ``` 安装完成后,你还需要下载并配置相应的浏览器驱动程序。Selenium支持各种浏览器,如Chrome、Firefox、Safari等。你可以在Selenium官方网站上找到相应的驱动程序下载链接。 2. 基本操作 Selenium提供了一系列方法来模拟用户在浏览器中的操作,如打开URL、点击元素、输入文本等。以下是一些常用的基本操作示例: - 打开浏览器并访问URL: ```python from selenium import webdriver driver = webdriver.Chrome() # 使用Chrome浏览器驱动 driver.get("https://www.example.com") # 打开指定URL ``` - 查找元素并操作: ```python element = driver.find_element_by_id("element_id") # 根据元素ID查找 element.click() # 点击元素 input_element = driver.find_element_by_name("input_name") # 根据元素名称查找 input_element.send_keys("Hello, World!") # 输入文本 ``` - 执行JavaScript代码: ```python driver.execute_script("window.scrollTo(0, document.body.scrollHeight);") # 滚动到页面底部 ``` 3. 高级操作 Selenium还提供了一些高级操作,如处理弹窗、切换窗口、等待元素加载等。以下是一些常用的高级操作示例: - 处理弹窗: ```python alert = driver.switch_to.alert # 切换到弹窗 alert.accept() # 接受弹窗 confirm = driver.switch_to.alert # 切换到确认框 confirm.dismiss() # 取消确认框 ``` - 切换窗口: ```python window_handles = driver.window_handles # 获取所有窗口句柄 driver.switch_to.window(window_handles[-1]) # 切换到最后一个窗口 ``` - 等待元素加载: ```python from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC element = WebDriverWait(driver, 10).until( EC.presence_of_element_located((By.ID, "element_id")) ) ``` 4. 测试框架 Selenium还可以与测试框架(如Pytest、JUnit等)结合使用,以便更好地组织和管理测试用例。你可以使用测试框架提供的断言方法来验证测试结果。 ```python import pytest def test_example(): driver = webdriver.Chrome() driver.get("https://www.example.com") assert "Example Domain" in driver.title # 断言页面标题包含指定文本 driver.quit() ``` 以上是一份简单的Selenium学习笔记,希望对你有所帮助。当然,Selenium还有很多其他功能和用法,你可以进一步深入学习和探索。祝你学习愉快!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值