python使用scrapy_scrapy运行几种方式

最新推荐文章于 2024-01-11 00:03:38 发布

暂停一下下

最新推荐文章于 2024-01-11 00:03:38 发布

阅读量1.8k

点赞数

文章标签： python使用scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32017023/article/details/112921008

版权

crawl语法: scrapy crawl

是否需要项目: yes

1.在cmd窗口执行$ scrapy crawl myspider

[ ... myspider starts crawling ... ]

2.pycharm运行

当你运行 scrapy command arg 这样的命令时,这里的 scrapy 实质是一个 python 脚本，它接受参数，调用 scrapy/cmdline.py 中的 execute() 函数.通过几下几步配置执行命令。

3.通过python脚本调用

这里主要通过scrapy.crawler.CrawlerProcess来实现在脚本里运行一个spider。# -*- coding: utf-8 -*-

from scrapy.crawler import CrawlerProcess

from scrapy.settings import Settings

#引用spider

from project.spiders.spider_name import spider_class

#配置setting，可自定义setting属性

settings = Settings()

process = CrawlerProcess()

#执行spider

process.crawl(CtripSpider)

process.start()

4.通过CrawlerRunner运行一个spider# -*- coding: utf-8 -*-

from twisted.internet import reactor

from scrapy.crawler import CrawlerRunner

from scrapy.settings import Settings

#引用spider

from project.spiders.spider_name import spider_class

#配置setting，可自定义setting属性

settings = Settings()

#执行spider

runner = CrawlerRunner(settings)

runner.crawl(spider_class)

reactor.run()

暂停一下下

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python使用scrapy_scrapy运行几种方式

crawl语法: scrapy crawl是否需要项目: yes1.在cmd窗口执行$scrapycrawlmyspider[...myspiderstartscrawling...]2.pycharm运行当你运行 scrapy command arg 这样的命令时,这里的 scrapy 实质是一个 python 脚本，它接受参数，调用 scrapy/cmdline.py 中的 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。