scrapy知识点

1.持久化存储
        - 编码流程:
            1.数据解析
            2.封装item类
            3.将解析的数据存储到实例化好的item对象
            4.提交item
            5.管道接收item然后对item进行io操作
            6.开启管道
         - 注意事项:
            - 将同一份数据存储到不同的平台中:
                - 管道文件中一个管道类负责将item存储到某一个平台中
                - 配置文件中设定管道类的优先级
                - process_item方法中return item的操作将item传递给下一个即将被执行的管道类
    2.全站数据爬取
        - 手动请求的发送:
            - 设定一个通用的url模板
            - 手动i请求的操作写在哪里:parse方法
            - yield scrapy.Request(url,callback)
    3.五大核心组件

猛击它

    4.post请求
        - start_requests(self)
        - post请求的手动发送:yield scrapy.FormRequest(url,callback,formdata)
        - COOKIES_ENNABLE = False

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值