爬虫
Aaaron.
这个作者很懒,什么都没留下…
展开
-
WebSocket + mitmproxy另类爬虫
WebSocket ,通过websocket可以实现浏览器与服务器进行双向通信,浏览器客户端可以给服务端发送数据,服务端能给浏览器客户端发送数据。我们可以利用这一点让服务端将要加密的参数发送给浏览器客户端,浏览器将接收到的参数传入目标加密函数并运行,就能得到加密结果,最后返回给服务器,实现间接的调用浏览器JS函数。关于websocket:http://www.ruanyifeng.com/blog/2017/05/websocket.htmlTornado框架的websocket服务参考:原创 2020-06-05 11:34:52 · 2618 阅读 · 0 评论 -
字体反爬详解
目前网页的字体多样化完全可以自定义,常见有eot,woff,ttf格式类型本次爬虫就针对以woff格式的字体而言:先看看不做措施造成的影响:http://maoyan.com/ 以猫*票房信息为例调试模式下票房数字是乱码的,在源代码中则是“&#xxxxx”的一窜字符故,不做措施直接爬取的数据是乱码的,就是调试模式中看的内容怎么做在...原创 2019-05-17 10:05:09 · 660 阅读 · 0 评论