pycharm实现scrapy爬虫的生成和入门

本文介绍了如何使用PyCharm创建Scrapy爬虫项目,强调不应在PyCharm内直接生成,而应通过Scrapy命令行创建,以避免缺少配置文件。在创建项目后,详细讲解了如何生成爬虫、启动爬虫以及进行命令行调试的方法。
摘要由CSDN通过智能技术生成

虽然是用pycharm进行调试,但是最开始一定不要在pycharm中生成项目,因为要用scrapy自己生成一个项目,否则会缺少如同scrapy.cfg的配置文件,导致Unknown command: crawl错误。
所以先在自己想要的地方开始:

scrapy startproject myproject

注意这个myproject是自定义的文件夹。然后在pycharm里找到这个项目。发现已经自动生成了这样的结构,也帮忙配置好了环境变量。
在这里插入图片描述
创建项目之后,我们还需要创建一个爬虫,官方的语法如下:

scrapy genspider [-t template] <name> <domain>

注意:name参数是爬虫名,不能与项目名相同,domain参数是想要爬取的网站。然后就能在spiders里面看到刚刚的生成的爬虫。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值