无论是简单网页还是采用异步加载技术的网页,都是通过GET方法请求网址来获取网页信息的。但如何通过获取登录表单后的信息的?本节将讲解Reqquests库的Post方法,通过观测表单代码和逆向工程来填写表单以获取网页信息,以及通过提交Cookie信息来模拟登录网站。
本文的主要知识点如下:
表单交互:利用Requests库的POST方法进行表单交互
Cookie:了解Cookie的基本概念
模拟登录:学会利用Cookie信息模拟登录网站
模拟登录
有时,表单字段可能通过加密或者其他形式进行包装。这就增大了构造表单的难度,这是可选择提交Cookie信息进行模拟登录。
Cookie概述
Cookie,指某些网站为了辨别用户身份、进行session跟踪而存储在本地终端上的数据。互联网购公司通过追踪用户的Cookie信息,给用户提供相关兴趣的商品。同样,因为Cookie保存了用户的信息,我们便可通过提交Cookie来模拟登陆网站。
提交Cookie模拟登录
下面以某网为例,查找Cookie信息并提交来模拟登录药智网。
(1)进入某网,打开Chrome浏览器的开发者工具,选择Network选项。
(2)手工输入账号和密码进行登录,此时会发现Network中会加载许多文件。
(3)这时并不需要查看登录网页的文件信息,而是直接查看登陆后的文件信息
(1)将