网页的切换与嵌套
网页的切换
在浏览器窗口中如果点击超链接标签会在当前的浏览器窗口中显示新的数据,但有些超链接标签点击后却会在一个新的窗口显示数据,这种情况下就无法对新的开的窗口页面进行操作了。
基于这种情况,我们就需要使用driver.switch_to.window()进行窗口切换,从而保证能够对打开的新窗口页面进行处理:
# 1. 获取当前所有的窗口
current_windows = driver.window_handles
# 2. 根据窗口索引进行切换
driver.switch_to.window(current_windows[1])
程序案例:
import time
from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
# 1、实例化浏览器
driver = Chrome()
# 2、打开对应的网页
driver.get('https://www.baidu.com')
# 3、设置浏览器窗口最大化
driver.maximize_window()
# 4、通过LINK_TEXT定位新闻的按钮元素(精确搜索)
button_element = driver.find_element(By.LINK_TEXT, '新闻')
# 5、对百度新闻的标签进行点击
button_element.click()
# 6、获取当前所有的窗口
current_windows = driver.window_handles
# 7、根据窗口索引进行切换
driver.switch_to.window(current_windows[1])
# 8、对打开的浏览器网页进行截屏,格式为png,否则会有警告
driver.save_screenshot('baidu.png')
time.sleep(10)
网页的嵌套
网页嵌套是HTML中的一种技术,专业名称为iframe(内嵌框架)。它允许在一个网页内嵌入另一个独立的网页。通过使用iframe,可以在当前页面中显示来自不同源或相同源的其他网页、文档或应用程序的内容,从而提升爬虫采集数据的难度。
当使用selenium访问网页时,默认是无法访问frame的内容的,对应的解决思路是通过调用driver.switch_to.frame()来切换嵌套的网页中,从而访问内嵌网页中的元素对象。
网易云歌单案例:
import time
from selenium import webdriver
from selenium.webdriver.common.by import By
# 1、创建浏览器对象并打开网易云音乐的网页
driver = webdriver.Chrome()
driver.get('https://music.163.com/')
# 2、等待3秒,保证嵌套页面加载完毕
time.sleep(3)
# 3、切换到嵌套页面中
driver.switch_to.frame('contentFrame')
# 4、定位网页中第一个歌单a标签,并点击a标签进入歌单详情页
element = driver.find_element(By.XPATH, '//*[@id="discover-module"]/div[1]/div/div/div[1]/ul/li[1]/div/a')
element.click()
time.sleep(3)