黄页88网站之加密字符串破解

本文介绍了如何爬取并解密黄页88网站中加密的公司详情信息,特别是针对手机号和带区号电话的加密处理。在获取到网页源码后,通过特定解密方式和字体文件映射来还原被加密的数据,详细解密过程和思路参考相关博客链接。
摘要由CSDN通过智能技术生成

网站:http://b2b.huangye88.com/

需求:爬取黄页88 网站下的一些公司的详情信息

eg:http://b2b.huangye88.com/gongsi/company561409/detail.html

出现的问题:在解析手机号的时候,遇到数据加密,在页面上看到正常的手机号,在网页源码中为加密字体

获取到网页的源码后,可以看到数据是这样的方式

获取过程不做赘述,相信熟悉一些爬虫的同学应该都清楚,现在说下基础解密方式

不多废话,直接上代码

    def decrypt_phone(encrypt_number):
        """
        :param encrypt_number: 加密后的手机号
        :return:
        """
        code_string = encrypt_number.strip(';')
        # 替换 &# 为 0,用于后面直接转换为10进制数
        code_string = code_string.repl
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值