Glidedsky第一关详细解答

最新推荐文章于 2023-12-22 12:00:47 发布

玩蛇工程师千寻

最新推荐文章于 2023-12-22 12:00:47 发布

阅读量1.3k

点赞数 2

分类专栏： python 文章标签： selenium xpath 正则表达式 cookie python

本文链接：https://blog.csdn.net/qq_45443898/article/details/113772570

版权

第一关是算是入门级的操作了。唯一比较麻烦的是，你直接用requests获取url的响应数据是不行的，网站要求你登录。
这个时候我们一般有两种方法，一种是手动在Headers头部信息里添加Cookie，另一种是使用selenium自动化登录网页。

Cookie：自行去浏览器里的Headers里复制粘贴到*处。

import requests

url='http://www.glidedsky.com/level/web/crawler-basic-1'
headers={
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.96 Safari/537.36',
    'Cookie': '***'

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

玩蛇工程师千寻

关注关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
4
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

glided_sky 镀金的天空爬虫闯关1-2 4-5 解题思路加代码

weixin_46011275的博客

12-10

2548

最近发现的一个爬虫练习网站,尝试着做了几道题,发现覆盖面很大,因此来记录分享一下自己的解题思路。 http://glidedsky.com/ 第一题和第二题两道问题都是相似的问题，区别在于一个数据加载在一页,一个数据加载在1000页中。但是要注意的是:直接用requests库请求目标网址会要求登录认证,因此要先把自己的登录信息获取。进入登录页面,尝试登录,发现浏览器发起了两次请求,一次post请求,然后发生了重定向,又对登录页面发起了一次get请求。可以先看看post请求传递了什么参数发现post

爬虫刷题-glidedsky

我想养只喵

11-13

3208

最近群里传的很火的一个爬虫练习网站.(网站做的非常走心, 支持一下.) url : http://glidedsky.com/ 做了几个题感觉非常有意思, 和大家交流分享一波. 第一题: 这里有一个网站，里面有一些数字。把这些数字的总和，输入到答案框里面，即可通过本关. 这个咱就不说了, 把数据全都取出相加就可以通关了. 第二题: 在第一题的基础上加了翻页.在code中加个链接迭代就行了. ...

4 条评论您还未登录，请先登录后发表或查看评论

GlideSky爬虫练习网站第一关详解

Code皮皮虾的博客

09-13

1692

文章目录前言1、第一关2、第一关答案及注释分析3、网页辅助分析前言今天无聊的刷着CSDN，偶然发现了个爬虫练习网站GlideSky，这让我虎躯一震，瞬间就来精神了，最为爬虫爱好者，对于这种网站当然是十分有兴趣的，于是我点进去看了看。首先要注册个账号，这不是什么问题，注册好后去看了看网站定位，如下 emm…确实不错，大家也可以去注册个账号练习练习话不多说，直接第一关 1、第一关 网站页面如下，就是一堆数字 2、第一关答案及注释分析 import requests from bs4 impo

爬虫专用网站glidedsky-爬虫-基础第一关

木子的博客

03-13

842

哈喽！大家好！分享一个专门用于检验你爬虫技术的网站，不会被请去喝茶的专用网站glidedsky 爬虫-基础第一关 废话不多说，自学Python两个月，第一次分享，过第一关着实废了不少功夫，以前学的不扎实，又翻了模拟登陆，去空格，计算数字等等重新学了一遍，最后才成功了，打算记录下来，虽然过程有点繁琐，但都是一步一个脚印踩出来的，虽然有便捷的方法，但我想用自己的方式拿下来，只有这样才更能理解爬取的整个过程是怎么回事，如若有不足之处还请多多指教！完整代码如下： import requests fr

python-GlidedSky爬虫闯关第一关

Fread的博客

05-11

1581

最近都在使用selenium就先使用着selenium来进行爬取 from selenium import webdriver name = '' pwd = '' num = [] x=1 s = 0 test = [] b = webdriver.Chrome() b.get('http://glidedsky.com/level/web/crawler-basic-1') user ...

GlidedShy 第一题实现自动登录和数据爬取

weixin_42375356的博客

11-27

1409

python 自动登录，控制浏览器，爬取信息练习 GlidedShy官网步骤：自动登录，输入账号密码选择题目爬取数据，自动提交后返回验证邮箱（注册时已人工验证）框架：Seleium控制浏览器 & bs4爬取数据代码注释已详细写出，之后会更新后续题目 # GlidedSky 第一题 # @Author: xiaozhu_sai # Date: 2020/11/26 """ 这里有一个网站，里面有一些数字。把这些数字的总和，输入到答案框里面，即可通过本关。待爬取网站 http:/

Glidedsky第二关详细解答（结合进程池）

qq_45443898的博客

02-23

380

第二关是解决1000个分页数字加减的问题，比第一关多了一个翻页的步骤。翻页只要用到requests.get的params参数即可。不多说，直接上代码： import requests from lxml import etree import re number_lists = [] url='http://www.glidedsky.com/level/web/crawler-basic-2' headers={ 'User-Agent': 'Mozilla/5.0 (Windows

GlidedSky爬虫网站练习基础1

小徐在努力_的博客

05-22

1168

GlidedSky爬虫网站练习第一关 无意中看到一个很不错的爬虫练习网站： GlidedSky爬虫练习网站是一个很不错的练习网站，但是先需要注册一下。 第一关是把网页中的数据求和，因为格式统一，所以可以用很多方法实现，在使用GET方法时，要加入User-Agent和cookie。 import requests import re import ...

【原创】GlidedSky第一关：requests+xpath方法

inganxu

07-31

612

就如CSDN其他的作者说的一样，GlidedSky网站主要是提供给python爬虫感兴趣的伙伴们一个交流练习的网站，希望有同样爱好的伙伴们，在尝试接触该网站前注意作者以下内容：定位镀金的天空是一个互联网技能认证网站，要保证用户解出一道题目就意味着拥有了解决类似问题相应的技能，所以会激励以下行为：解决题目证明自己拥有题目所考核的相关技能。协助他人学习掌握题目所考核的相关技能。对应的，会惩罚以下行为：不具备题目所考核的相关技能的情况下，包括但不限于抄袭答案，代码等形式通过题目。协助他人

Python高阶爬虫之字体反扒（GlideSky字体解密）

Code皮皮虾的博客

09-26

1680

文章目录前言1、网页查看2、字体反扒过程（细心看哦）3、字体反扒完整代码4、网页辅助分析5、运行结果前言本次的字体反扒是Glidedsky爬虫网站的一到题目，难度是有的，大家好好看，好好学！希望你们有所收获。温馨提示：保护好头发！！！ 1、网页查看一共1000页 url后的page值就是当前页数，所以进行多页爬取的时候要拼接page值以达到多页爬取目的 2、字体反扒过程（细心看哦）可见，网页源码中的图片与页面显示的图片不一致，这是因为源码中的数字是经过加密后再显示到页面上的注

python爬虫练习网站，墙裂安利这个可以练习爬虫的网站

m0_59162248的博客

12-05

368

python爬虫练习网站，墙裂安利这个可以练习爬虫的网站今天无意间发现的一个大佬做的网站，http://www.glidedsky.com/，需要注册登录后跟着大佬提供的题目做，刚刚完成了第一个题目，以为能手到擒来，没想到有csrf-...

爬虫10+练习 1-glidedsky基础两篇爬虫

xinyue9966的博客

10-29

1329

glidedsky基础两篇爬虫第一篇查看数字的class类型查看哪个包会返回登录状态，显而易见是crawler-basic-1,GET包下面是代码部分 import requests from lxml import etree header = { 'Cookie': '_ga=GA1.2.1184184785.1603891776; _gid=GA1.2.1035086129.1603891776; __gads=ID=dbb3e55c8f8b5dbd-22d7259d6ac4009

爬虫-基础1 GlidedSky

龚政的博客

04-23

360

GlidedSky 爬虫基础 1 爬虫的目标很简单，就是拿到想要的数据。这里有一个网站，里面有一些数字。任务是计算这些数字的总和。待爬取网站分析我一般编写爬虫的流程： 1：检查展现数据和原始数据是否一致。 2：寻找原始元素的位置。一般数据会在 DOM文档中，json 文件中，js文件中，ws 等传输数据中。 3：直接发起请求，检查是否有反爬或者加密。 4：不能直接拿到数据，就使用 postman 完全模拟浏览器请求。 5：使用postman 完全模拟浏览器基本上都可以拿到数据的。 6：有加密就开

Glide二次封装库的使用

李彬博客专栏

05-03

4856

上一篇文章介绍了如何基于Glide进行二次封装。基于Glide的二次封装本篇文章将详细讲述如何使用。初始化在Application中: ImageLoader.init(getApplicationContext());为了防止oom,加入如下代码，清理内存： @Override public void onTrimMemory(int level) { su

Android图片加载框架最全解析（五），Glide强大的图片变换功能

skyang在路上

09-03

188

参考郭神的文章： Android图片加载框架最全解析（五），Glide强大的图片变换功能

【练习】爬虫-基础2 - GlidedSky 源码参考！