python ttfont,Python爬虫杂记 - 字体文件反爬(二)

本文介绍如何处理动态字体文件的反爬问题,以猫眼电影网为例,利用fontTools库将字体文件转为XML,找到图形与编码的对应关系,从而解析动态字体。示例代码展示了获取并解析字体文件,实现字符替换的过程。
摘要由CSDN通过智能技术生成

字体文件反爬

在搞定静态字库反爬之后, 可以解决部分字体文件的反爬, 但动态字文件反爬是解决不掉的。此文章就是为解决动态字体文件的反反爬而写。本想以去哪儿网(手机端)的为例, 奈何手机端的字库反爬可能需要账号密码才会出现, 遂改用猫眼电影网的字体文件反爬为例。源码在最后!

1. 开发者模式查看网页内容

0e2e1aa6d270

开发者模式中的字体无法显示

2. 下载网页源码保存至本地查看

0e2e1aa6d270

网页源码下载到本地后查看

3. 字体文件保存在本地通过 font creator 查看字体文件信息

0e2e1aa6d270

字体文件1

0e2e1aa6d270

字体文件2

可以查看到字体文件的映射关系是动态的, 需要解决的就是通过某种方法来找到映射与数字之间的关系。

4.通过fontTools库, 将字库文件转换成xml格式

0e2e1aa6d270

映射关系与字体信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值