scrapy学习笔记--scrapy命令

最新推荐文章于 2024-05-07 23:01:16 发布

冻云-FrozenCloud

最新推荐文章于 2024-05-07 23:01:16 发布

阅读量1.1k

点赞数

分类专栏： python 文章标签： python scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ioiol/article/details/47381309

版权

python 专栏收录该内容

29 篇文章 1 订阅

订阅专栏

使用scrapy是一定需要使用到它的命令工具的，所以熟练掌握会很方便。

查看所有可用的命令了：

scrapy -h

h的意思就是help，这一点与大多数应用的命令是一致的。

如图一共有十五个可用命令，这些命令分为两类：全局命令、项目命令。

全局命令有：startproject、settings、runspider、shell、fetch、view、version。

其余为项目命令。

创建项目命令

scrapy startproject myproject

其中myproject是项目名称。

进入项目目录：

cd myproject

这一点与Linux或者window的命令是一致的。

在当前项目创建爬虫：

scrapy genspider [-t template] <name> <domain>

这个命令需要在已经存在的项目中使用。该方法可以使用提前定义好的模板来生成spider。也可以自己创建spider的源码文件。

运行爬虫：

scrapy crawl <spider>

运行contract检查：

scrapy check [-l] <spider>

列出当前项目中所有可用的spider：

scrapy list

使用EDITOR 中设定的编辑器编辑给定的spider：

scrapy edit <spider>

fetch命令：

scrapy fetch <url>

使用Scrapy下载器(downloader)下载给定的URL，并将获取到的内容送到标准输出。

该命令无需项目存在。

View命令：

scrapy view <url>

在浏览器中打开给定的URL，并以Scrapy spider获取到的形式展现。有些时候spider获取到的页面和普通用户看到的并不相同。因此该命令可以用来检查spider所获取到的页面，并确认这是您所期望的。

Shell命令：

scrapy shell [url]

以给定的URL(如果给出)或者空(没有给出URL)启动Scrapy shell。

parse命令：

scrapy parse <url> [options]

获取给定的URL并使用相应的spider分析处理。

如果您提供 --callback 选项，则使用spider的该方法处理，否则使用 parse 。

支持的选项:

--spider=SPIDER: 跳过自动检测spider并强制使用特定的spider
--a NAME=VALUE: 设置spider的参数(可能被重复)
--callback or -c: spider中用于解析返回(response)的回调函数
--pipelines: 在pipeline中处理item
--rules or -r: 使用 CrawlSpider 规则来发现用来解析返回(response)的回调函数
--noitems: 不显示爬取到的item
--nolinks: 不显示提取到的链接
--nocolour: 避免使用pygments对输出着色
--depth or -d: 指定跟进链接请求的层次数(默认: 1)
--verbose or -v: 显示每个请求的详细信息

settings命令：

scrapy settings [options]

获取Scrapy的设定

runspider命令：

scrapy runspider <spider_file.py>

在未创建项目的情况下，运行一个编写在Python文件中的spider。

version命令：

scrapy version [-v]

输出Scrapy版本。配合 -v 运行时，该命令同时输出Python, Twisted以及平台的信息，方便bug提交。

deploy命令：

scrapy deploy [ <target:project> | -l <target> | -L ]

将项目部署到Scrapyd服务。

bench命令：

scrapy bench

运行benchmark测试。

自定义项目命令

通过 COMMANDS_MODULE 来添加自己的项目命令。

冻云-FrozenCloud

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。