今日因为工作需要,需要抓取淘宝上一些商品详情信息,而商品详情信息必须要在登陆以后才能进行访问,所以想要抓取商品信息,模拟登陆是第一个必须要解决的问题。
淘宝的模拟登陆说难也不难,说不难,也蛮多坑的。今天就在这把我破解淘宝登陆的整个完整过程,细细给你说来。(PS:看完后,觉得有帮助,麻烦点个在看呗!)
思路:
获取你在网上已经找了很多资料,用fiddler工具或者mitmproxy代理设置response,然后修改js,目的是为了掩盖自己是selenium驱动的真相,也就是想修改window.navigator.webdriver的属性。这种方法听起来很美丽,但是实践起来还是不太理想。今天我们用到的技术栈是selenium+chromedriver,后面的修改都是针对这两个来的。
关键点:
不浪费大家时间,直接上重点。要想破解淘宝的登录,必须要解决两个问题:
- 修改
webdriver的特有标识。 - 修改
window.navigator.webdriver值为false。
隐藏chromedriver身份:
1. 修改webdriver特有标识
根据stackoverflow

本文详细介绍了如何通过修改特有标识和属性值来隐藏身份,从而成功模拟登录淘宝。在登录过程中,遇到的滑块验证码也能通过自动化方式破解。文章提供了解决淘宝模拟登录问题的关键步骤,包括文件修改和使用Selenium的行为链来完成滑块验证。
最低0.47元/天 解锁文章
4967

被折叠的 条评论
为什么被折叠?



