GlideSky爬虫练习网站第一关详解

25个爬虫项目宝藏教程,你值得拥有!


前言

今天无聊的刷着CSDN,偶然发现了个爬虫练习网站GlideSky,这让我虎躯一震,瞬间就来精神了,最为爬虫爱好者,对于这种网站当然是十分有兴趣的,于是我点进去看了看。

首先要注册个账号,这不是什么问题,注册好后去看了看网站定位,如下
在这里插入图片描述
emm…确实不错,大家也可以去注册个账号练习练习

话不多说,直接第一关


1、第一关

在这里插入图片描述

网站页面如下,就是一堆数字
在这里插入图片描述


2、第一关答案及注释分析

import requests
from bs4 import BeautifulSoup

#头文件
headers = {
    "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36",
    #注意带上Cookie,不然会被拦截,参考图1,大家参考自己填上
    "Cookie": ""
}
#最后的总数
sum = 0
#请求地址
url = "http://glidedsky.com/level/web/crawler-basic-1"
response = requests.get(url=url,headers=headers)

#使用 BeautifulSoup 解析
data = BeautifulSoup(response.text,"lxml")

#参考图2,获取全部数字,遍历
div_list = data.find_all(class_="col-md-1")
for div in div_list:
    d = BeautifulSoup(str(div),"lxml")
    sum += int(d.text.strip())

print(sum)

在这里插入图片描述
提交答案
在这里插入图片描述
闯关成功!!!


3、网页辅助分析

图1
在这里插入图片描述

图2
在这里插入图片描述



CSDN独家福利降临!!!


最近CSDN有个独家出品的活动,也就是下面的《Python的全栈知识图谱》,路线规划的非常详细,尺寸 是870mm x 560mm 小伙伴们可以按照上面的流程进行系统的学习,不要像我当初一样没人带自己随便找本书乱学,系统的有规律的学习,它的基础才是最扎实的,在我们这行,《基础不牢,地动山摇》尤其明显。

最后,如果有兴趣的小伙伴们可以酌情购买,为未来铺好道路!!!

在这里插入图片描述


博主会持续更新,有兴趣的小伙伴可以点赞、关注和收藏下哦,你们的支持就是我创作最大的动力!

Java学习从入门到大神学习目录索引

博主开源Python爬虫教程目录索引(宝藏教程,你值得拥有!)

在这里插入图片描述

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值