python之爬虫requests与scrapy比较及scrapy常用命令

最新推荐文章于 2021-12-17 17:06:41 发布

我要糖

最新推荐文章于 2021-12-17 17:06:41 发布

阅读量327

点赞数 3

分类专栏： python 爬虫文章标签： python requests scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44790423/article/details/99691354

版权

python 同时被 2 个专栏收录

31 篇文章 3 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

我们前面学习了requests和scrapy两种方式，作为两种技术路线，我们需要知道他们的相同点和不同点，以及我们应该按情况来使用

相同点

都可以进行页面请求和爬取
可用性好，文档丰富，入门简单
不用处理js，提交表单，应对验证等功能（需要扩展才能实现）

不同点

requests	scrapy
页面级爬虫	网站级爬虫
功能库	框架
并发性考虑不足	并发性好，性能较高
重点在于页面下载	重点在于爬虫结构
定制灵活	一般定制灵活，深度定制困难
上手十分简单	入门稍难

补充：
scrapy常用命令

命令	说明	格式
start project	创建一个新工程	scrapy startproject<name’ [dir]
genspider	创建一个爬虫	scrapy genspider [options’ <name’ <domain’
settings	获得爬虫的配置信息	scrapy settings [options’
crawl	运行一个爬虫	scrapy crawl <spider’
list	列出工程中的所有爬虫	scrapy list
shell	启动URL调试命令行	scrapy shell [url]

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python之爬虫requests与scrapy比较及scrapy常用命令

我们前面学习了requests和scrapy两种方式，作为两种技术路线，我们需要知道他们的相同点和不同点，以及我们应该按情况来使用相同点都可以进行页面请求和爬取可用性好，文档丰富，入门简单不用处理js，提交表单，应对验证等功能（需要扩展才能实现）不同点requestsscrapy页面级爬虫网站级爬虫功能库框架并发性考虑不足并发性好，性能较高...
复制链接

扫一扫

专栏目录

我要糖 CSDN认证博客专家 CSDN认证企业博客

码龄5年

205: 原创

4万+: 周排名

145万+: 总排名

27万+: 访问

: 等级

4791: 积分

3503: 粉丝

505: 获赞

57: 评论

1712: 收藏

私信

关注

热门文章

分类专栏

深度学习 3篇
Qt开发 4篇
C++经验总结 4篇
机器学习 1篇
linux系统 6篇
selenium 5篇
appium 3篇
通信协议 1篇
密码学 1篇
pytest 4篇
mySQL 8篇
Matlab 18篇
Vue 9篇
Java 40篇
jQuery 10篇
JS 26篇
牛客网题库 25篇
LaTex 1篇
系统安装 1篇
python 31篇
pygame 8篇
插件安装 3篇
HTML+CSS 7篇
爬虫 13篇
微信小程序 3篇
单片机 21篇

最新评论

单片机之基础编程八位数码管（三）
做而论道_CS: 数字滚动显示的汇编程序。 ORG 0 JMP BG ORG 11 MOV TH0, #248 MOV P0, #0 INC B MOV P2, B MOV A, B ANL A, #7 ADD A, #30H MOV R0, A MOV P0, @R0 MOV R0, B CJNE R0, #0, E_T0 MOV R0, #39H MOV A, @R0 LP: DEC R0 XCH A, @R0 CJNE R0, #30H, LP MOV 39H, A E_T0: RETI BG: MOV TMOD, #1 MOV TH0, #255 SETB TR0 MOV IE, #82H MOV 30H, #3FH MOV 31H, #06 MOV 32H, #5BH MOV 33H, #4FH MOV 34H, #66H MOV 35H, #6DH MOV 36H, #7DH MOV 37H, #7 MOV 38H, #7FH MOV 39H, #6FH SJMP $ END 是不是很简单？
python学习之安装插件
m0_67050253: 显示分享的内容被删除了哎
C++ 读入批量图片+HOG特征提取+PCA降维
chloe_le_le: 数据降维
如何给sublime配置python环境
m0_60979323: 为什么是乱码啊
SVM训练（C++实现）
冲一冲搏一搏: 为啥SVM只能用线性的核函数呀

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。