Python 爬虫闯关（第四关）

hoxis

于 2018-08-13 07:59:54 发布

阅读量888

点赞数

分类专栏： python学习有趣的Python 文章标签： pythn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bruce_6/article/details/81623484

版权

地址：http://www.heibanke.com/lesson/crawler_ex03/

本关的难点是从页面解析并拼接出需要的目标密码，理解题目很重要啊~

另外获取密码的页面加载耗时很长，也需要考虑如何处理。

解题思路

首次进入题目页面，同样的跳转到了登录页面：

登录页面

登录成功后，出现如下页面，发现还是猜密码。

登录成功

但这次不是试出来的需要找出来，那从哪里找呢？先随便输入个密码

密码错误页面

提示密码错误，同时给出了找密码的页面，继续访问：

密码列表

初步观察，页面的表格中有两列，其中一列是密码的位置，另外一列是密码的值，猜测是将密码的值拼接成一个字符串，但是页面只有13页，每页8个数值，正好100个数，而位置数最大的出现了100，将这100个数放入到dict(location,value)里，然后再对dict的key进行排序，对value进行拼接，不就得到密码了嘛。

然而现实是残酷的，发现密码的位置中存在重复，也就是遍历完13页数据，并不能得到所有的密码值，然后我就猜想是不是对没有出现在页面的位置进行填充0处理，发现还是失败。

在多次试验中，发现每次获取到的密码的位置并不是相同的，也就是页面里的随机的意思，也就是不断的调用查询密码列表页面，总是能够获取到所有密码的值的。

实现代码

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python 爬虫闯关（第四关）

地址：http://www.heibanke.com/lesson/crawler_ex03/本关的难点是从页面解析并拼接出需要的目标密码，理解题目很重要啊~另外获取密码的页面加载耗时很长，也需要考虑如何处理。解题思路首次进入题目页面，同样的跳转到了登录页面：登录成功后，出现如下页面，发现还是猜密码。但这次不是试出来的需要找出来，那从哪里找呢？先随便输入个密...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。