Scrapy学习总结(一)——基本命令及使用基础

最新推荐文章于 2022-11-21 17:38:10 发布

二十五六岁

最新推荐文章于 2022-11-21 17:38:10 发布

阅读量149

点赞数

分类专栏： scrapy 文章标签： scrapy

本文链接：https://blog.csdn.net/qq_40803626/article/details/88387943

版权

scrapy 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1. scrapy --help

Scrapy 1.5.0 - project: mingyan

Usage:
  scrapy <command> [options] [args]

Available commands:
  bench         Run quick benchmark test
  check         Check spider contracts
  crawl         Run a spider
  edit          Edit spider
  fetch         Fetch a URL using the Scrapy downloader
  genspider     Generate new spider using pre-defined templates
  list          List available spiders
  parse         Parse URL (using its spider) and print the results
  runspider     Run a self-contained spider (without creating a project)
  settings      Get settings values
  shell         Interactive scraping console
  startproject  Create new project
  version       Print Scrapy version
  view          Open URL in browser, as seen by Scrapy

Use "scrapy <command> -h" to see more info about a command

2. scrapy startproject xxx 创建一个xxx项目

3. scrapy genspider xxx example.com

会在spider目录下创建一个‘xxx.py’文件，其中的spider的name=‘xxx’

name是指spider的名字
example.com 是指要爬取的网站的域名
有两种情况：
1、在工程中产生一个spider
2、在同一个工程产生多个spider，不同的spider要求name不同

4. scrapy crawl name 运行工程里的爬虫

5. scrapy runspider xxx.py 运行单个爬虫

二十五六岁

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy学习总结(一)——基本命令及使用基础

1. scrapy --helpScrapy 1.5.0 - project: mingyanUsage: scrapy &amp;lt;command&amp;gt; [options] [args]Available commands: bench Run quick benchmark test check Check spider contracts...
复制链接

扫一扫