1. 通过自定义字体来反爬
反爬思路:使用自定义字体文件
解决思路:切换到手机版/解析字体文件进行翻译
2. 通过css来反爬
反爬原理:源码数据不为真实数据,需要通过css位移才能产生真实数据
解决方法:计算css的偏移
3. 通过js动态生成数据进行反爬
反爬原理:通过js动态生成
解决思路:解析关键js,获得数据生成流程,模拟生成数据
4. 通过编码格式进行反爬
反爬原理:不使用默认编码格式,在获取响应之后,通常爬虫使用utf-8格式进行解码,此时解码结果将会是乱码或者报错
解决思路:根据源码进行多格式解码,获取真正的解码格式