1.有的时候使用selenium自动化模块时会遇到下拉表单的问题,name如何解决这个问题呢?
Selenium专门提供了Select类来处理下拉框:
# 导入 Select 类
from selenium.webdriver.support.ui import Select
select = Select(driver.find_element(By.XPATH, '填入xpath语法'))
select.select_by_index(1)
select.select_by_value("0")
select.select_by_visible_text(u"文本内容")
2.selenium中的execute_script方法可以实现对浏览器进度条的下拉,使用方法如下:
from selenium import webdriver
# 初始化浏览器
driver = webdriver.Chrome(options=options, executable_path=WEBDRIVER_PATH)
driver.get(url)
driver.execute_script("window.scrollBy(0,500)") # 括号里面填入每次页面进度条下拉多少
time.sleep(2)
driver.execute_script("window.scrollBy(0,1000)")
time.sleep(2)
driver.execute_script("window.scrollBy(0,1500)")
time.sleep(2)
driver.execute_script("window.scrollBy(0,2000)")
time.sleep(2)
driver.execute_script("window.scrollBy(0,2500)")
进度条的下拉一般是用在页面动态加载请求中。有的数据需要下拉到页面的最下端才能获取到这个时候就需要配合使用ajax请求,拿某宝举个例子:
这个是我利用xpath获取到的各个店铺的id,可以看到数据只有6条,但是当我将进度条下拉到最下面的时候就会发现,数据变成了20条
不难看出这个页面一定用了ajax动态加载的技术,我们使用selenium抓取的时候就会出现数据抓取不全的情况,这个时候就可以用到execute_script方法对浏览器的界面进行拖动,等他的数据全部加载完成了再去进行数据的抓取