最近在写一个针对大众点评的爬虫框架。
本篇讨论大众点评搜索页的字体加密,相关代码也可以在github中找到。
首先查看加密:
请求回来后发现html源码为乱码。
所以我们的目标就是找到“乱码”和数字的映射,替换即可。
那么问题来了,哪来的这个映射呢?就是woff文件。
我们可以在查看器中观察到三个大众点评自带字体:
,我们根据链接下回来之后,使用fontcreater打开
我们获得了字体,把鼠
最近在写一个针对大众点评的爬虫框架。
本篇讨论大众点评搜索页的字体加密,相关代码也可以在github中找到。
首先查看加密:
请求回来后发现html源码为乱码。
所以我们的目标就是找到“乱码”和数字的映射,替换即可。
那么问题来了,哪来的这个映射呢?就是woff文件。
我们可以在查看器中观察到三个大众点评自带字体:
,我们根据链接下回来之后,使用fontcreater打开
我们获得了字体,把鼠