在之前的文章介绍了利用python的requests库进行图书馆用户登录和利用urllib2进行图书馆登录(只进行一次post请求,就可以爬取登录成功的页面),还介绍了urllib2的重定向解决。这里是根据学校图书馆进行的操作,其他情况要分别作出调整。
现在是将urllib2的重定向截断,利用其cookie进行提交。依然以图书馆登录为例,在之前的requests库登录中,浏览器发起了一次post请求,可是却进行了两次操作,一次是post,接着是get,这里运用了重定向。在这里,我们就需要进行两次提交,一次是post,得到我们需要的cookie参数,利用cookie参数,再进行第二次请求,返回登录成功界面。
以下为代码,这是第一次post请求,
import urllib2
import url