说明
- 需求:后端爬虫,实现爬取图片返回前端,前端填完表之后后端爬取相应信息。
- redis, flask:redis存cookies,flask做后端
- requests:没什么特别复杂的,关键的是弄清楚常用库函数的使用,抓包分析的时候搞清楚网站的认证逻辑
- 请求网址:陕师大研究生网(内网才能访问)
三步采坑指南
Step1 抓包分析得到COOKIE
最关键的一点就在这,分析 什么时候设置的cookie
第一次请求的时候,并没有设置cookie,cookie是在请求验证码图片的时候才设置的
Step2 分析POST认证过程
form data带着隐藏的CSRF_TOKE