Python之scrapy命令使用详解

最新推荐文章于 2024-05-25 20:00:00 发布

皮皮鱼哟

最新推荐文章于 2024-05-25 20:00:00 发布

阅读量575

点赞数

分类专栏：笔记文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43750377/article/details/107834909

版权

笔记专栏收录该内容

8 篇文章 0 订阅

订阅专栏

目录

Scrapy Commands

Scrapy Commands

全局命令

[ scrapy startproject {project_name} ] - 创建爬虫项目
[ scrapy genspider {-t template} spider_name domain ] - 创建爬虫文件
[ scrapy runspider {spider_file.py} ] - 直接通过运行.py文件来启动爬虫
[ scrapy shell {url} ] - 打开scrapy-shell交互器（可以使用Selector进行调试）
[ scrapy fetch {url} ] - 该命令会通过scrapy-downloader将网页的源代码下载并显示出来
[ settings ] - 查看项目设置
[ version ] - 查看版本
[ view ] - 该命令会将网页document内容下载下来，并且在浏览器显示出来（可以判断是否是Ajax请求）

项目命令（项目命令只能在项目目录下使用）

[ scrapy crawl {spider_name} ] - 启动爬虫程序
[ scrapy list ] - 显示项目中所有的爬虫
[ check ] - 用于检查代码是否有错误
[ edit ] - 编辑
[ parse ] - 解析调试
[ bench ] - 速度测试

使用示例（如果命令显示无效，在命令前面加上“python -m”）

[ scrapy startproject example ] - 创建名字为example的项目
[ cd example ] - 切换到该项目
[ scrapy genspider sample_spider www.sample.com ] - 创建名字为sample_spider的爬虫文件，并且初始域名为www.sample.com
[ scrapy crawl sample ] - 执行sample爬虫程序
[ scrapy crawl sample -o sample.json ] - 保存输出结果到json文件（还有csv，xml，pickle，marshal，ftp等格式可以存取）

Tips

[ scrapy crawl sample --nolog ] - 不打印日志
[ scrapy crawl sample --headers ] - 打印响应头信息
[ scrapy crawl sample --no-redirect ] - 不做跳转（禁止重定向）

shell调试

[ python3 -m scrapy shell ] - 开启shell调试
[ response.selector.xpath(’’) ] - 使用xpath定位
[ response.selector.css(’’) ] - 使用css定位

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python之scrapy命令使用详解

目录Scrapy Commands全局命令项目命令（项目命令只能在项目目录下使用）使用示例（如果命令显示无效，在命令前面加上“python -m”）Tipsshell调试Scrapy Commands全局命令[ scrapy startproject {project_name} ] - 创建爬虫项目[ scrapy genspider {-t template} spider_name domain ] - 创建爬虫文件[ scrapy runspider
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。