scrapy命令行详解

最新推荐文章于 2024-03-11 19:06:58 发布

mr.ocean

最新推荐文章于 2024-03-11 19:06:58 发布

阅读量1.1k

点赞数

分类专栏： scrapy 基础

本文链接：https://blog.csdn.net/qq_45020131/article/details/104533646

版权

基础同时被 2 个专栏收录

18 篇文章 0 订阅

订阅专栏

scrapy

2 篇文章 0 订阅

订阅专栏

前言

最近闲来无事，在使用scrapy写爬虫时发现自己在终端中却只会创建项目和运行scrapy shell，后来查看了一些scapy命令行的官方文档，发现其中几个还是挺有意思的。scrapy命令行官方文档

命令行介绍

scrapy -h 显示可用的命令行工具
scrapy -h # 可显示所有可用的命令
创建项目，创建完成之后可用tree命令查看一下目录结构

 1. 创建项目： scrapy startproject myproject[project_dir]
        (1) 创建项目之后需要进入项目中 cd myproject
        (2) 进入项目中创建一个spider： scrapy genspider mydomain mydomain.com

在这里插入图片描述

check：检查程序用有没有错误，没有则返回ok

语法： scrapy check [-l] <spider>

在这里插入图片描述

list: 返回所有可执行scrapy文件

语法： scrapy list

在这里插入图片描述

edit: 编辑文件 # 用处不大且操作繁琐，还不如再ide里编辑呢
语法： scrapy edit <spider>
fetch: 输出log文件，返回网页源代码

语法：scrapy fetch <url>

在这里插入图片描述
-view: 打开一个url地址并将它下载下来，可做调试

语法： scrapy view <url>

在这里插入图片描述

shell:scrapy shell则是一个类似于ipython的交互式环境，其中里面的response则为返回的响应结果，可调用多种方法

语法： scrapy shell <url>

在这里插入图片描述
response中的方法:

parse: 获取给定的URL并使用处理它的spider解析它，使用与–callback选项一起传递的方法，如果没有给定，则解析。 # 需要再项目环境下执行

语法： scrapy parse <url> [options]

示例：
在这里插入图片描述
返回结果：

-settins ：在scrapy settings中获取值

语法: scrapy settings [options]

在这里插入图片描述

runspider: 进入到项目目录中,运行spider文件

语法： scrapy runspider <spider_file.py>

在这里插入图片描述

version：查看当前版本

语法： scrapy version
      scrapy version -v  #查看所有所属依赖库的版本

在这里插入图片描述

bench：测试当前每分钟的抓取效率

语法： scrapy bench  # 页面/每分钟

在这里插入图片描述

小结

以上就是scrapy命令行的大部分内容了，要是想要更加深入的了解scrapy框架，可以去仔细的观看scrapy的官方文档，一定会让你受益匪浅。scrapy官方文档

mr.ocean

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
scrapy命令行详解

前言最近闲来无事，在使用scrapy写爬虫时发现自己在终端中却只会创建项目和运行scrapy shell，后来查看了一些scapy命令行的官方文档，发现其中几个还是挺有意思的。scrapy命令行官方文档命令行介绍scrapy -h 显示可用的命令行工具scrapy -h # 可显示所有可用的命令创建项目，创建完成之后可用tree命令查看一下目录结构 1. 创建项目： scrapy...
复制链接

扫一扫

专栏目录