最近想爬取淘宝的一些商品,但是发现如果要使用搜索等一些功能时基本都需要登录,所以就想出一篇模拟登录淘宝的文章!
Python资源共享群:626017123
看了下网上有很多关于模拟登录淘宝,但是基本都是使用 scrapy、pyppeteer、selenium 等库来模拟登录,但是目前我们还没有讲到这些库,只讲了 requests 库,那我们今天就来使用 requests 库模拟登录淘宝!
讲模拟登录淘宝之前,我们来回顾一下之前用 requests 库模拟登录豆瓣和新浪微博的过程:这一类模拟登录是比较简单的登录,只需要在请求登录时将用户名和密码上传验证通过就成功了,也就是说一步到位!
而淘宝登录就比较复杂,为什么说复杂呢?因为淘宝登录涉及参数多且请求不止一次!我们就先来讲讲淘宝登录的流程,先把流程原理搞懂,再去敲代码,这样大家就容易理解!
一、淘宝登录流程
为了便于大家理解,猪哥画了一个非标准的淘宝登录请求时序图
淘宝ua参数:ua(User-Agent) 故名用户代理,淘宝的 ua 参数加入了浏览器、ip、电脑、时间等信息,然后加密生成,在很多地方使用,不仅仅是登录!
上图是比较详细的流程图,从代码层面考虑猪哥将模拟登录淘宝分为以下四个步骤:
- 输入用户名后,浏览器会向淘宝(t