题目地址:http://match.yuanrenxue.com/match/7
这里可以直接抓取接口的数据,请求的时候没有存在反爬
可以看到返回的值都已以空格分隔的字符串,还有一个base64编码的woff文件
我们将这个woff文件保存下来,并将其转换为xml文件
from fontTools.ttLib import TTFont
url = 'http://match.yuanrenxue.com/api/match/7?page=1'
response = requests.get(url).json()
woffb64 = response['woff']
with open('07.woff', 'wb') as f:
f.write(base64.b64decode(woffb64.encode()))
TTFont('07.woff').saveXML('07.xml')```
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210326103658403.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NjU2NDQxOA==,size_16,color_FFFFFF,t_70#pic_center)
此时可以查看到字体文件的内容,其中最主要的是两个部分【cmap】和【glyf】
【cmap】表示的是我们响应的内容(源码内容)与na