selenium+chromedriver获取动态网页数据以及模拟鼠标操作后才能获得的数据

本文介绍了如何利用selenium配合chromedriver来获取动态加载的网页数据,特别是那些需要通过鼠标点击或其他交互才能显示的内容。首先,确保下载与Chrome浏览器版本匹配的chromedriver。然后,通过selenium模拟鼠标操作,实现动态界面的交互,从而获取所需信息。最后,提供了相关源码供参考。
摘要由CSDN通过智能技术生成

1.下载chromedriver,记住chromedriver和chrome浏览器版本有对应关系

2.获得动态加载后的界面模拟鼠标操作,获得需要点击等特定操作后才能获得的动态加载的数据

3.源码:

from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains



#下载后的chromedriver地址,我这里是windows版本的
CHROME_DRIVER_PATH = 'D:\\Code\imgageRecognition\\site_scrapy\\chromedriver.exe'



#下载动态界面,返回可被beatifulsoup4解析的数据
def get_dynamic_html(site_url):
    print('开始加载',site_url,'动态页面')
    chrome_options = webdriver.ChromeOptions()
    #ban sandbox
    chrome_options.add_argument('--no-sandbox')
    chrome_options.add_argument('--disable-dev-shm-usage')
    #use headless
    #chrom
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值