python 22 selenium滚动和常见反爬

最新推荐文章于 2024-08-12 20:29:32 发布

紫眸猫星人

最新推荐文章于 2024-08-12 20:29:32 发布

阅读量617

点赞数

文章标签： python selenium chrome

本文链接：https://blog.csdn.net/woaixuexi6666/article/details/126394524

版权

本文介绍了Python的selenium库在网页滚动和反爬方面的应用。详细讲解了如何执行页面滚动，包括语法和示例；自动登录的方法，包括requests和selenium实现，并附带了查找cookie的步骤；以及代理IP的设置，对于requests和selenium两种方式进行了说明。

摘要由CSDN通过智能技术生成

python 22天 selenium滚动和常见反爬

一页面滚动设计

1 语法:执行滚动操作

执行js中滚动代码：window . scrollBy ( x 方向偏移量，y 方向偏移量)

x , y 是像素值，
窗口左右滚动，就 y =0, 设置x的值，x为正，窗口就向右滚动，x的值为负，窗口就向左滚动，
窗口上下滚动就是x为0，设置y的值，y 的值为正，窗口就向下滚动，y的值为负，窗口就向上滚动。
为了加载完整个页面，就要让这个页面全部加载完，就要设置整个窗口一直滚动到最后，可以设置一个循环，让这个循环遍历完，就可以加载完这个页面，需要不停的试一试。
所有需要的数据都加载完了，就可以去分析数据。

2 . 例题展示

from time import sleep
from  selenium.webdriver import  Chrome
from bs4 import BeautifulSoup
##执行滚动操作    -   执行js中滚动代码：window.scrollby(x方向偏移量，y方向偏移量)
# 语法：b.execute_script('window.scrollBy(0, 1800)')  ## b去执行的脚本代码（写的是执行的代码，就是窗口执行滚动）
b = Chrome()
b.get('https://www.jd.com/')
b.find_element_by_id('key').send_keys('手机\n')
sleep(1)

for x in range(10):  # 为了滚动完整个界面，所有，就加入for循环，让它滚动5次，每次滑动700个像素，每次滚动后就睡眠1秒
    b.execute_script('window.scrollBy(0, 700)')
    sleep(1)


##解析数据，使用bs4

soup = BeautifulSoup(b.page_source,'lxml')
all_goods = soup.select('.gl-warp>li')
print(len(all_goods))