有时需要对列表进行翻页操作,Selenium同样提供了相应API。
分页处理逻辑大致可分为以下三个步骤:
(1)获取总页数。
(2)获取所有分页并循环翻页。
(3)针对每一次分页进行后续逻辑处理。
以百度贴吧Python为例:
1.先定位到分页div
2.定位到尾页按钮
# -*- coding: utf-8 -*-
from selenium import webdriver
import time
from selenium.webdriver.common.by import By
driver = webdriver.Edge()
data = {
'index_url':'http://tieba.baidu.com/f?ie=utf-8&kw=python',
'pagination_id':'frs_list_pager',
'':''
}
# 访问Python吧首页
# frs_list_pager
driver.get(data['index_url'])
# 定位等到分页div
pagination_div = driver.find_element(by=By.ID