爬虫大框架之 - Scrapy(四)

Scrapy四

一,Request

  1. meta传参(实现不同回调方法之间数据的传递)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0pGz4j8M-1592033249221)(assets/.png)]

  2. dont_filter不过滤(实现请求相同url不会被过滤)

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LHSseMrt-1592033249223)(assets/.png)]

  3. POST请求(进行模拟登陆)[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9KQOUa7f-1592033249226)(assets/.png)]

二,GitHub登录

  1. 抓包 最好是在无痕窗口(没有任何缓存和cookies数据)
  2. 分析登录的请求,哪些参数是固定的,哪些参数是变化的(多抓几次包对比提交的参数)
  3. 获取变化的参数,构造data数据包,用于POST请求提交

三,Response

  1. 源码[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3368ZRwV-1592033249228)(assets/.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bD69etP8-1592033249230)(assets/.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0YGL1wem-1592033249232)(assets/.png)]

四,日志使用

  1. 直接在回调函数里面写[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-C9cDxBTY-1592033249236)(assets/.png)]

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aftDoJg2-1592033249239)(assets/.png)]

  2. setting.py 里面设置,全部储存在文件里

    LOG_FILE = "log.log"	# 储存的文件
    LOG_LEVEL = 'DEBUG'		# 设置日志的等级(DEBUG文件很多)
    

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I1FP5ZEU-1592033249243)(assets/.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BYcYmGtY-1592033249246)(assets/.png)]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值