selenium 翻页_利用selenium实现自动翻页爬取某鱼数据

基本思路:

首先用开发者工具找到需要提取数据的标签列表:

d9a800c0d4bb1989f7f67cc8f54e5f88.png利用xpath定位需要提取数据的列表

fa8f4753912a11ee673f4e15554b2cd9.png然后再逐个提取相应的数据:

9954ff331aa071af3e68a41c74575c4a.png保存数据到csv:

6c73b9e85e5e7ea95c2e109feafc4141.png利用开发者工具找到下一页按钮所在标签:

ae7fcef83105dd9dee6c50e6f69a9f55.png利用xpath提取此标签对象并返回:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,以下是使用Selenium自动点击标题爬取详细内容并翻页的Python代码: ```python from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC # 设置浏览器驱动路径 driver_path = "C:\chromedriver_win32\chromedriver.exe" # 创建浏览器对象 driver = webdriver.Chrome(executable_path=driver_path) # 打开网页 driver.get("http://www.example.com") # 等待页面加载完成 wait = WebDriverWait(driver, 10) wait.until(EC.presence_of_element_located((By.ID, "content"))) # 获取所有标题元素 title_elements = driver.find_elements_by_xpath("//h2/a") # 遍历标题元素并依次点击 for title_element in title_elements: # 获取标题文本和链接 title_text = title_element.text title_link = title_element.get_attribute("href") # 点击标题 title_element.click() # 切换到新窗口 driver.switch_to.window(driver.window_handles[-1]) # 获取详细内容 content_element = driver.find_element_by_id("content") content_text = content_element.text # 处理详细内容 # 关闭窗口 driver.close() # 切换回原窗口 driver.switch_to.window(driver.window_handles[0]) # 翻页 next_page_element = driver.find_element_by_xpath("//a[@class='next']") next_page_element.click() # 关闭浏览器 driver.quit() ``` 这个代码使用了Selenium中的WebDriverWait等待页面加载完成,然后通过XPath定位标题元素并依次点击,切换到新窗口获取详细内容,处理完毕后关闭窗口并切换回原窗口,最后通过XPath定位翻页元素并点击实现自动翻页
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值