scrapy基本命令

最新推荐文章于 2024-05-07 23:01:16 发布

爱吃辣椒的锅包肉

最新推荐文章于 2024-05-07 23:01:16 发布

阅读量303

点赞数

分类专栏： scrapy 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44301439/article/details/109626910

版权

scrapy 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.创建一个新项目：

scrapy startproject myproject

2.在新项目中创建一个新的spider文件：

scrapy genspider mydomain baidu.com

mydomain为spider文件名，baidu.com为爬取网站域名

3.运行spider文件：

scrapy crawl <spider>

4.检查spider文件有无语法错误：

scrapy check

5.列出spider路径下的spider文件：

scrapy list

6.编辑spider文件：

scrapy edit <spider>

7.将网页内容下载下来，然后在终端打印当前返回的内容，相当于 request 和 urllib 方法：

scrapy fetch <url>

8.将网页内容保存下来，并在浏览器中打开当前网页内容，直观呈现要爬取网页的内容:

scrapy view <url>

9.打开 scrapy 显示台，类似ipython，可以用来做测试：

scrapy shell [url]

10.输出格式化内容：

scrapy parse <url> [options]

11.返回系统设置信息：

scrapy settings [options]

12.运行spider：

scrapy runspider <spider_file.py>

爱吃辣椒的锅包肉

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scrapy基本命令

1.创建一个新项目：scrapy startproject myproject2.在新项目中创建一个新的spider文件：scrapy genspider mydomain baidu.commydomain为spider文件名，baidu.com为爬取网站域名3.运行spider文件：scrapy crawl <spider>4.检查spider文件有无语法错误：scrapy check5.列出spider路径下的spider文件：scrapy list6.编辑
复制链接

扫一扫

专栏目录

爱吃辣椒的锅包肉 CSDN认证博客专家 CSDN认证企业博客

码龄6年

63: 原创

29万+: 周排名

72万+: 总排名

8万+: 访问

: 等级

829: 积分

1280: 粉丝

84: 获赞

31: 评论

468: 收藏

私信

关注

热门文章

分类专栏

最新评论

猿人学-第三题
以太猪猪: fiddler中不是返回了值吗，他直接复制可以返回值得header不就行了，都说了这个顺序不对会导致没有data返回，你咋觉得这个顺序能自己随便排呢
简单JS补环境
鸿鸿: 大佬，检测onwheel方法，怎么知道的？运行代码没有显示他未定义额
猿人学-第三题
我是阿尼君: 你的这个header的顺序是自己排的吗？
猿人学-第三题
我是阿尼君: 很奇怪我浏览器和fid抓出来的 header都跟你的不一样你是怎么取的
猿人学-第一题
鸿鸿: 大佬。其中执行J('0x0', ']dQW') 为 replace 可知要进行字符串替换 J('0x1', 'GTu!') 为 mwqqppz '\x27' + mw + '\x27' 为'mw'，怎么执行的这个代码

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。