Python爬虫学习笔记 (15) [中级] 动态网页处理 selenium 3 - Glidedsky爬虫基础2

最新推荐文章于 2021-12-13 10:45:57 发布

Alice

最新推荐文章于 2021-12-13 10:45:57 发布

阅读量376

点赞数

分类专栏： Python爬虫文章标签： python selenium 爬虫

本文链接：https://blog.csdn.net/weixin_54955821/article/details/115584905

版权

更新日期: 2021.04.10本节内容：镀金的天空: http://glidedsky.com一个专供爬虫升级打怪的网站~~做了基础 1&2 部分，以下是基础 2 部分~目录1. 需求描述2. 代码3. 关于 selenium 的使用4. selenium 的其他功能 - 先不学啦1. 需求描述爬虫往往不能在一个页面里面获取全部想要的数据，需要访问大量的网页才能够完成任务。目标网站一个有1000个网页，每个页面有有12个数字，拿到每页上的数据，把这些数字求和。答案正确，即可通关。

摘要由CSDN通过智能技术生成

更新日期: 2021.04.10

本节内容 ：

镀金的天空: http://glidedsky.com

一个专供爬虫升级打怪的网站~~

做了基础 1&2 部分，以下是基础 2 部分~

1. 需求描述

爬虫往往不能在一个页面里面获取全部想要的数据，需要访问大量的网页才能够完成任务。

目标网站一个有1000个网页，每个页面有有12个数字，拿到每页上的数据，把这些数字求和。答案正确，即可通关。

在这里插入图片描述

2. 代码

使用selenium输入用户名和密码，点击登录
使用selenium翻页
汇总，计算~

from selenium import webdriver
from selenium.webdriver import ChromeOptions
from bs4 import BeautifulSoup
import time
import random


# 配置 driver
my_options = ChromeOptions()
my_options.add_experimental_option('excludeSwitches', ['enable-automation'])
no_image = {
   "profile.managed_default_content_settings.images"

最低0.47元/天解锁文章

Alice

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
Python爬虫学习笔记 (15) [中级] 动态网页处理 selenium 3 - Glidedsky爬虫基础2

更新日期: 2021.04.10本节内容：镀金的天空: http://glidedsky.com一个专供爬虫升级打怪的网站~~做了基础 1&2 部分，以下是基础 2 部分~目录1. 需求描述2. 代码3. 关于 selenium 的使用4. selenium 的其他功能 - 先不学啦1. 需求描述爬虫往往不能在一个页面里面获取全部想要的数据，需要访问大量的网页才能够完成任务。目标网站一个有1000个网页，每个页面有有12个数字，拿到每页上的数据，把这些数字求和。答案正确，即可通关。
复制链接

扫一扫

专栏目录