scrapy命令交互模式简单介绍--小布老师网易云课堂

scrapy命令交互模式介绍

scrapy 命令交互模式启动

$ scrapy shell 网址[不需要引号]

命令交互模式中函数介绍

request 对网址发起请求的请求信息

response网址服务器响应请求,发回的响应信息

view(response)调用系统自带浏览器,查看response中保存着从网址中获取的网页数据

fetch(url)在交互模式下,重新对一个url网址发送请求,自动更新到request和response中

scrapy项目爬虫文件说明

init.py -> 保持默认,不需要做任何修改

items.py-> 自定义项目类的地方,也就是爬虫获取到数据之后,传入管道文件(pipelinies.py)的载体

pipelinies.py->项目管道文件,对传入的项目类中的数据进行一个清理和入库

settings.py->Scrapy项目的设置文件,例如下载延迟,项目管道文件中类的启用以及自定义中间件的启用和顺序

spiders目录-》里面只有一个init.py文件,在该目录下定义爬虫类并继承scrapy.Spider

middlewares.py ->中间件配置文件

Scrapy爬虫文件ganji.py介绍

name="zufang" 爬虫名字,如果项目中有多个爬虫,名字别重复

start_urls = ['http://....'] 爬虫启动后自动爬取的链接,列表内可以放多个链接

def parse(self,response):爬虫启动时,爬取链接成功后自动回调的函数,默认parese,参数self和response也是必须得

response.xpath("").extract():固定格式,如果xpath("")里面不放任何字符串会报错,如果里面的字符串是/结尾,则代码会报错

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

swarding99

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值