Python爬虫实战：css加密动态字体练习猿人学比赛题目七题详解

最新推荐文章于 2024-08-15 16:55:51 发布

weixin_46564418

最新推荐文章于 2024-08-15 16:55:51 发布

阅读量340

点赞数

分类专栏： python爬虫

本文链接：https://blog.csdn.net/weixin_46564418/article/details/115231062

版权

博客介绍了如何使用Python爬虫解决猿人学比赛中的一个挑战，涉及抓取接口数据，解密CSS中的动态字体，通过转换WOFF文件到XML，解析出对应字符并找出最高胜点的召唤师。

摘要由CSDN通过智能技术生成

题目地址：http://match.yuanrenxue.com/match/7

这里可以直接抓取接口的数据，请求的时候没有存在反爬

在这里插入图片描述
可以看到返回的值都已以空格分隔的字符串，还有一个base64编码的woff文件
我们将这个woff文件保存下来，并将其转换为xml文件

from fontTools.ttLib import TTFont
url = 'http://match.yuanrenxue.com/api/match/7?page=1'
response = requests.get(url).json()
woffb64 = response['woff']
with open('07.woff', 'wb') as f:
    f.write(base64.b64decode(woffb64.encode()))
TTFont('07.woff').saveXML('07.xml')```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326103658403.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NjU2NDQxOA==,size_16,color_FFFFFF,t_70#pic_center)
此时可以查看到字体文件的内容，其中最主要的是两个部分【cmap】和【glyf】
【cmap】表示的是我们响应的内容（源码内容）与na