python selenium判断网页加载,python+selenium采集动态加载(懒加载)的页面内容

前言

有些网站使用了懒加载技术:只有在浏览器中纵向滚动条滚动到指定的位置时,页面的元素才会被动态加载。注意,在加载之前,selenium的page_source是不会包含该页面的内容,page_source只包含加载出来的页面内容。那么如何实现加载全部内容,就需要模拟人滚动滚动条的行为,实现页面加载

代码如下:

from selenium import webdriver

import time

driver_path = r"E:\chromedriver.exe"

def get_brower():

#创建浏览器驱动

chrome_options = webdriver.ChromeOptions()

chrome_options.add_argument("--start-maximized")

browser = webdriver.Chrome(executable_path=driver_path, options=chrome_options)

time.sleep(3)

return browser

def drop_down(url,browser):

#加载界面

browser.get(url)

#获取页面高度

height = browser.execute_script("return action=document.body.scrollHeight")

#将滚动条调到页面底部

browser.execute_script("window.scrollTo(0,document.body.scrollHeight)")</

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值