【练习】爬虫-基础1 - GlidedSky 源码参考!

网上有很多大佬为了帮助渣渣爬虫提升,都有搭建爬虫练习平台网站,这种网站的好处是可以练习爬取,同时网上也有很多参考教程,尤其适合学习练手使用。

368e29879072261e1ef3b3f3a11eee45.png

爬虫练习网站,镀金的天空-GlidedSky,爬虫-基础1,爬取网页上的数据,计算求和。

爬虫-基础1

“爬虫的目标很简单,就是拿到想要的数据。这里有一个网站,里面有一些数字。把这些数字的总和,输入到答案框里面,即可通过本关。”

http://glidedsky.com/level/web/crawler-basic-1

第一关还是比较简单的,数据的获取也有很多种方法和形式,这里本渣渣抛砖引玉,使用了正则获取数据,可惜网站本身的邮箱验证出错,获取到的计算答案无法验证,以及进入到下一关。

01673b6759d893ca5018b716d206d13e.png

难道是本渣渣ip还是操作有问题?!

e004ab1ab628a2c18c8c938eaed0a367.png

这里介绍了一下两种计算方法:

方法一

循环加

numbers=0
for div in divs:
    numbers=numbers+int(div.strip())

print(numbers)
方法二

sun 函数

numbers=[]
for div in divs:
    number=int(div.strip())
    #print(number)
    numbers.append(number)

print(numbers)
num=sum(numbers)

写的比较粗糙,仅供学习参考,如需完整源码,可关注本渣渣公众号

7f2867cd555ff4cc3791c718ee1e7bb2.jpeg

后台回复:“爬虫基础1” 

获取完整源码

·················END·················

你好,我是二大爷,

革命老区外出进城务工人员,

互联网非早期非专业站长,

喜好python,写作,阅读,英语

不入流程序,自媒体,seo . . .

公众号不挣钱,交个网友。

读者交流群已建立,找到我备注 “交流”,即可获得加入我们~

听说点 “在看” 的都变得更好看呐~

关注关注二大爷呗~给你分享python,写作,阅读的内容噢~

扫一扫下方二维码即可关注我噢~

92fa69a6f456b4b4dd16d79e42c0e5c0.jpeg

9de497df94ff7eeb15ccad7d59003dd0.png

关注我的都变秃了

说错了,都变强了!

不信你试试

1746b72ddf3e9a166dc3e8bf68887d6a.jpeg

扫码关注最新动态

公众号ID:eryeji

  • 8
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值