你已经知道了对方是
如何自定义字体加密的了
你要想去反反爬
你就要先站在对方的角度去思考问题
有句话这么说来着
“知己知彼,才能那啥”
那么对于像猫眼电影、大众点评等等
那样的 css 自定义字体加密
应该怎么破呢?
接下来就是
学习 python 的正确姿势
有人说了
不就是把字体通过 unicode 编码吗?
那就简单了啊
把每个字的编码找到
然后使用字典把编码和对应的字对应起来
抓取分析的时候
直接替换不就得了
有道理是有道理
但是
如果我每次返回给你的编码都不一样呢?
你说死不死
好了好了,先别哭得那么舒服
我们来看看天猫电影票房榜单的页面
正如你所看到的那样
这里也使用了字体加密
通过源代码我们可以看到
font-face这里制定了字体文件路径
还是熟悉的配方
熟悉的味道~