小结
在发起请求时,在请求头中带上cookie数据
然后访问登陆后可见的网页
那么就可以实现
目标,获取博客后台草稿文章数量
文章管理-CSDN博客
https://mp.csdn.net/
未登陆的时候
访问上述网址,会跳转
问题
为什么会发生跳转,在后台发生了什么
带上cookie去发起请求
如果可以得到 文本 草稿箱 代表访问成功
分析-找到请求时带的cookie
重新访问页面
找到请求头
找到cookie数据
提取出来
同时拿到user agent
基本的架子先塔起来
请求头字典完善
》流程
复制的user-agent与cookie都是字符串
把它们转成字典
然后添加到请求头中
》方式常用,封为模块
实际在使用的时候还需要清掉前后的空格
最终版
完成代码,爬取登陆后可见的内容
结果
拿到了位置序号,表明成功获取到了整个响应