作为一个学生,多写代码能培养出良好的写作风格与不错的逻辑思维能力
昨天在看github项目时候发现有个项目提到了http://www.glidedsky.com这个。我点进去发现是一个爬虫网站
又因为目前没事做,决定来写一写,看看自己能达到什么样子
第一题内容
第一题,首先来看题目如下:
进去发现应该是有一页数字,让你爬取下来
第一题思路
F12,查看每一个元素位置(总结:自我习惯将第一个与最后一个做对比,如果不对的话就对折查看,虽然一般来说是不存在的)
第一个位置:/html/body/div/main/div[1]/div/div/div/div[1]
最后一个位置:/html/body/div/main/div[1]/div/div/div/div[1200]
可以看出只有最后一个不同,以for循环然后带入路径去获取这些路径
获取到之后相加,或者放入到列表,在使用sum求和
方法
模块使用selenium或者requests等都是可以的,具体看每个人喜好,详细代码就不写了。
自己的问题
一:
我使用的是selenium,不要问为啥不用requests,我是不会告诉你们我是不会提交账号和用户名的