scrapy是专业的python爬虫框架,它的命令需要在命令行中执行。
scrapy命令行格式:
>scrapy <command> [options] [args]
scrapy常用命令:
- startproject 创建一个新工程 scrapy startproject <name> [dir]
- genspider 创建一个爬虫 scrapy genspider [options] <name> <domain>
- settings 获得爬虫配置信息 scrapy settings [options]
- crawl 运行一个爬虫 scrapy crawl [options]
- list 列出工程中所有爬虫 scrapy list
- shell 启动url调试命令行 scrapy shell [url]