1、理解下 session (会话)
所谓的会话,你可以理解成我们用浏览器上网,到关闭浏览器的这一过程。session是会话过程中,服务器用来记录特定用户会话的信息。
比如今天双11,你淘宝网浏览了哪些商品,购物出里放了多少件物品,这些记录都会被保存在session中。
session 和 cookies 有什么关系呢?
session和cookies的关系还非常密切——cookies中存储着session的编码信息,session中又存储了cookies的信息。
当浏览器第一次访问购物网页时,服务器会返回set cookies的字段给浏览器,而浏览器会把cookies保存到本地。
等浏览器第二次访问这个购物网页时,就会带着cookies去请求,而因为cookies里带有会话的编码信息,服务器立马就能辨认出这个用户,同时返回和这个用户相关的特定编码的session。
其实这句话很绕,简单理解就是,cookies里有session,session里有cookies,反正两者联系密切!
基础知识可见之前的博客Python爬虫笔记——post请求、cookies及session
以下是新做的项目中的登录的代码,
用类的形式写出来了。
import requests
from lxml.html import etree
class F4Work:
def __init__(self, phonenumber=None):
self.session = requests.session()
self.url = 'https://f4.work/login.php'
self.headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.