滑块验证码的尝试博客地址: https://cloud.tencent.com/developer/article/1191105
ActionChains方法:
move_to_element(to_element) ---- 鼠标移动到某个元素
click_and_hold(on_element = None) --- 点击鼠标左键,不松开
move_by_offset(xoffset, yoffset) ---- 鼠标从当前位置移动到某个坐标
release(on_element = None) -- 在某个元素位置松开鼠标左键
perform() ---- 执行操作,这个很重要,调用上面的方法后,一定要执行perform才能真正执行
崔庆才大神的网络爬虫干货总结链接: https://cloud.tencent.com/developer/article/1366434
从抓取、解析、存储、反爬、加速五个方面介绍了Python进行网络爬虫开发的相关知识点和技巧,
一。 抓取
服务端渲染: 使用基本的HTTP请求库就可抓取, 应用最多的是requests
客户端渲染方法有四种:
1. 寻找Ajax接口, 通过设置代理来查看接口比如 Fiddler/Charles;
2. 模拟浏览器执行, 适用于网络接口和逻辑较复杂情况, 直接抓可见数据, 比如 Sele