揭秘爬虫加密乱码

以下代码可以得到字体库

def make_font_file(base64_string: str):
    bin_data = base64.decodebytes(base64_string.encode())
    return bin_data

解析乱码

1.在pycharm上生成需要的16进制对应的数

'龒龥麣麣'.encode("unicode-escape")
b'\\u9f92\\u9fa5\\u9ea3\\u9ea3'
'餼驋龒龒'.encode("unicode-escape")
b'\\u993c\\u9a4b\\u9f92\\u9f92'

2.将网页原代码里需要转的乱码复制到"https://www.motobit.com/util/base64-decoder-encoder.asp"或者用第一段代码生成字体库
在这里插入图片描述
生成.woff或.ttf文件

3.在fontcreater软件上打开刚存的文件就可生成对应的码表
4.将码表的对应关系用字典的形式显示。

如果每个页面的码表对应方式不一样,利用OCR图片识别的方法的解码方式

from PIL import Image,ImageDraw,ImageFont
import os
text = "餼驋龒龒"
im = Image.new("RGB",(80,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值