Python—Selenium的一些使用方法

最新推荐文章于 2024-07-31 15:55:27 发布

️珊锋

最新推荐文章于 2024-07-31 15:55:27 发布

阅读量151

点赞数

文章标签： selenium python

本文链接：https://blog.csdn.net/qq_45886514/article/details/109726067

版权

Selenium的方法

一，提取标签内容，属性值

find_element仅仅能够获取元素，不能够直接获取其中的数据，如果需要获取数据需要使用以下

方法:

获取文本：element.text

获取属性值：element.get_attribute(“href”)

使用示例：

import time

from selenium import webdriver

# 获取浏览器驱动对象
browser = webdriver.Chrome()

# 打开指定URL
browser.get('https://www.douban.com')

# 定位h1标签
ret = browser.find_elements_by_tag_name("h1")
print(ret[0].text)
# 输出：豆瓣

ret = browser.find_elements_by_link_text("下载豆瓣 App")
print(ret[0].get_attribute("href"))
# 输出：https://www.douban.com/doubanapp/app?channel=nimingye

time.sleep(3)

browser.quit()

二，处理cookie

通过driver.get_cookies()能够获取所有的cookie

把cookie转化为字典

from selenium import webdriver

browser = webdriver.Chrome()

browser.get("http://www.baidu.com")

cookie_list = browser.get_cookies()
print(cookie_list)

# 整理为requests等需要的字典方式，因为浏览器在发送新请求时 携带的cookie只有name、value
# 所以此时提取的也只有name、value，其他的不需要
cookie_dict = {x["name"]: x["value"] for x in cookie_list}
print(cookie_dict)

# 关闭页面
browser.close()

删除cookie

# 删除一条cookie
browser.delete_cookie("CookieName")
# 删除所有的cookie
browser.delete_all_cookies()

添加cookie

# 添加cookie
browser.add_cookie({"name":"laowang", "email":"dong4716138@163.com"})

三，页面等待

为什么需要等待？

如果网站采用了动态html技术，那么页面上的部分元素出现时间便不能确定，这个时候就可以设置一个等待时间，强制要求在时间内出现，否则报错

页面等待的方法

直截了当的做法
time.sleep(10)
等待某个条件的做法
下面代码是获取京东网站的搜索输入框

import time

from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By

# 创建浏览器驱动对象
browser = webdriver.Chrome()

# 创建等待操作对象
wait_ob = WebDriverWait(browser, 10)

# 加载url
browser.get("http://jd.com")

# 等待条件到来
search_input = wait_ob.until(EC.presence_of_element_located((By.ID, 'key')))

print(search_input)

# 输入内容
search_input.send_keys("Mac Pro")

# 延时等待以便于观看
time.sleep(3)

# 退出
browser.quit()

四，页面前进和后退

import time
from selenium import webdriver

browser = webdriver.Chrome()
browser.get("http://jd.com")

time.sleep(2)

browser.get("http://ganji.com")

time.sleep(2)

# 后退
browser.back()

time.sleep(1)

# 前进
browser.forward()

time.sleep(1)

browser.quit()

五、selenium的优缺点

selenium能够执行页面上的js，对于js渲染的数据和模拟登陆处理起来非常容易
selenium由于在获取页面的过程中会发送很多请求，所以效率非常低，所以在很多时候需要酌情使用

️珊锋

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python—Selenium的一些使用方法

Selenium的方法一，提取标签内容，属性值find_element仅仅能够获取元素，不能够直接获取其中的数据，如果需要获取数据需要使用以下方法:获取文本：element.text获取属性值：element.get_attribute(“href”)使用示例：import timefrom selenium import webdriver# 获取浏览器驱动对象browser = webdriver.Chrome()# 打开指定URLbrowser.get('https://
复制链接

扫一扫