Scrapy四
一,Request
-
meta传参(实现不同回调方法之间数据的传递)
-
dont_filter不过滤(实现请求相同url不会被过滤)
-
POST请求(进行模拟登陆)
二,GitHub登录
抓包
最好是在无痕窗口(没有任何缓存和cookies数据)- 分析登录的请求,哪些参数是固定的,哪些参数是变化的(多抓几次包对比提交的参数)
- 获取变化的参数,构造data数据包,用于POST请求提交
三,Response
- 源码
四,日志使用
-
直接在回调函数里面写
-
setting.py
里面设置,全部储存在文件里LOG_FILE = "log.log" # 储存的文件 LOG_LEVEL = 'DEBUG' # 设置日志的等级(DEBUG文件很多)