python爬虫解决赶集网扫码获取手机号

(1)正常的抓取页面:
不需要扫码,需要点击查看的
这里写图片描述
但是没有这个必要,我们仔细看html代码:
这里写图片描述
发现里面就已经包含了手机号码;点击查看手机号只是个摆设。

(2)需要扫码的一个页面,网址为:

http://hz.ganji.com/fang1/2938272612x.htm

这里写图片描述

这个的话我们再次查看html代码:

这里写图片描述

发现并没有手机号存在;
先别着急,我们先研究一下二维码到底包含了什么信息:
用(草料识别二维码或者python库识别)发现解析出来是:

http://3g.ganji.com/hz_fang1/2938272612x

我们发现:
我们访问的网址和二维码访问得到的网址如下:

访问:
http://hz.ganji.com/fang1/2938272612x.htm
二维码解析:
http://3g.ganji.com/hz_fang1/2938272612x

主要不同的就是多了(3g),然后就是hz和fang1位置变了。
我们用电脑访问解析出来的网址:

这里写图片描述
看到没,出现了手机号。
我们只需要把原网址拼接成http://3g.ganji.com/…这种类型
就可以不用理会二维码了。二维码也是个摆设。

欢迎阅读我的更多文章。
欢迎进(Q)群,帮你解决问题:
在这里插入图片描述

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值