关于scrapydweb使用遇到的几个问题以及解决方法

最新推荐文章于 2024-05-26 16:50:09 发布

莫霄霆

最新推荐文章于 2024-05-26 16:50:09 发布

阅读量1.9k

点赞数

文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_60570576/article/details/121594534

版权

之前部署爬虫都是使用的crawlab，但是项目本身比较大，每次上传爬虫都需要将整个项目上传（拆成小的又很麻烦)，所以决定将crawlab中的项目迁移到scrapydweb上。

安装部署流程就不详细道来了，主要是分享之前在使用的时候遇到的一些问题。

一.部署项目的路径

开始部署的时候，是将我的整个git项目路径部署到scrapydweb上，也就是scrapy.cfg文件所在目录

但是在scrapydweb上无法显示我的scrapy项目，修改到scrapy.cfg所在目录的上一级目录

就可以正常显示了

二. “Not a directory” 报错

出现这个问题主要是我在代码中添加了

这个主要是使用了os.path,在scrapyd-client(GitHub - scrapy/scrapyd-client: Command line client for Scrapyd server) 中有解释

三. 报错:没有“_job” 参数

这是因为我在代码中进行了初始化，使用了__init__()方法，添加**kwargs即可，即可兼容_job参数。

四. 爬虫运行一小段时间自动停止

因为我在代码中需要传递参数，所以需要使用scrapydweb的settings & arguments设置，但是

在additional中scrapydweb会默认配置settings参数，导致我的爬虫莫名其妙的翻了十页就自动停止，后来查看log 的时候发现是因为翻页数量导致的爬虫停止。

我自己没有设置翻页数量，那只有scrapydweb默认设置的了

将其默认参数删除，爬虫就恢复正常了

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
关于scrapydweb使用遇到的几个问题以及解决方法

scrapydweb使用问题及解决办法
复制链接

扫一扫

莫霄霆 CSDN认证博客专家 CSDN认证企业博客

码龄3年

2: 原创

118万+: 周排名

155万+: 总排名

3万+: 访问

: 等级

48: 积分

9: 粉丝

14: 获赞

16: 评论

62: 收藏

私信

关注

热门文章

最新评论

python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）
qq_22681681: 倒不不能说有些玩爬虫的对selenium不齿，其实最主要的是那个玩意儿慢，还有可能冒出一堆奇怪的bug，维护...一言难尽。所以一般都能尽量用js的手段解决的，就用js手段处理了，这种cloud免费的5秒盾，最主要的就是指纹的采集。模拟一下浏览器指纹就行了
python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）
however,.: 又不行了
python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）
ABCFH123: 没有用无头模式吗
python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）
qq_27578069: 使用这个模块打开了浏览器但是会屏蔽代理这个该如何解决
python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）
遥远的妳: 博主，请问一下是不是只支持python3.7以上版本，我的一直报错 from __future__ import annotations ^ SyntaxError: future feature annotations is not defined

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

python+undetected_chromedriver+chrome绕过五秒盾（cloudflare）

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。