最近在写爬虫爬取大众点评,这个网站目前有两种加密方式,今天说其中一种——字体库加密。如图地址中的数字,它使用了自己的字体库。
通过network查看可发现每个方块对应一个类似编码的东西,如图。
之后从网页的css加载文件中找出.woff文件下载下来,使用fontcreator软件打开是这样的。如图。
使用识图软件或者QQ文字提取把图中编码与文字一一对应上就可以进行大众点评的地址信息解密了,可以发现网页中的编码后四位与图中的编码后四位是相同的。识别提取结果如下。(之截取了部分)
最近在写爬虫爬取大众点评,这个网站目前有两种加密方式,今天说其中一种——字体库加密。如图地址中的数字,它使用了自己的字体库。
通过network查看可发现每个方块对应一个类似编码的东西,如图。
之后从网页的css加载文件中找出.woff文件下载下来,使用fontcreator软件打开是这样的。如图。
使用识图软件或者QQ文字提取把图中编码与文字一一对应上就可以进行大众点评的地址信息解密了,可以发现网页中的编码后四位与图中的编码后四位是相同的。识别提取结果如下。(之截取了部分)