10.1处理登录表单
在客户端(浏览器)向服务器提交HTTP请求的时候,两种最常见用到的方法是GET和POST。使用GET方法的时候,查询字符串(名称/值对)是在GET请求的url中发送的:url长度有限制,而且数据会清楚出现在url中。
按照规定,GET请求只应用于获取数据,因此前面介绍的都是使用requests库的get方法爬取
相对于GET请求,POST只应用于提交数据。因为查询字符串(名称/值对)在POST请求的HTTP消息体中,所以敏感数据不会出现在url中,多数也不会被保存在浏览器历史或web服务器日志中
10.1.1处理登录表单
处理登录表单可以分为两步:
(1)研究网站登录表单,构造POST请求的参数字典。
(2)提交post请求