黄页88网站反爬措施对手机号进行了一些加密处理。这里介绍一下怎么解密手机号码的方法。
首先,我们看一下网站显示的手机号是这样的:
显示的手机号
使用ctrl c复制粘贴后变成了这样:
复制后的手机号码
而实际上,用Python爬虫获取到的内容是这样的:
爬虫获取到的数据
经过分析,发现这些数据其实有以下特点:
每次刷新网页,编码会变
编码之间其实有关系(实际上就是0-9转换成了16进制)
所以,我们的思路就是:
确定手机号码开头1对应的是第一个编码
然后根据第一个编码获取0-9对应的16进制编码
在通过编码检索出这串编码对应的电话号码
步骤:
首先爬取到电话号码的代码
code_list='&#