pycharm实现scrapy爬虫的生成和入门

最新推荐文章于 2023-12-08 16:13:55 发布

reisaru

最新推荐文章于 2023-12-08 16:13:55 发布

阅读量910

点赞数 1

分类专栏： Python 网络信息检索文章标签： python scrapy 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41337100/article/details/106456551

版权

本文介绍了如何使用PyCharm创建Scrapy爬虫项目，强调不应在PyCharm内直接生成，而应通过Scrapy命令行创建，以避免缺少配置文件。在创建项目后，详细讲解了如何生成爬虫、启动爬虫以及进行命令行调试的方法。

摘要由CSDN通过智能技术生成

虽然是用pycharm进行调试，但是最开始一定不要在pycharm中生成项目，因为要用scrapy自己生成一个项目，否则会缺少如同scrapy.cfg的配置文件，导致Unknown command: crawl错误。
所以先在自己想要的地方开始：

scrapy startproject myproject

注意这个myproject是自定义的文件夹。然后在pycharm里找到这个项目。发现已经自动生成了这样的结构，也帮忙配置好了环境变量。
在这里插入图片描述
创建项目之后，我们还需要创建一个爬虫，官方的语法如下：

scrapy genspider [-t template] <name> <domain>

注意：name参数是爬虫名，不能与项目名相同，domain参数是想要爬取的网站。然后就能在spiders里面看到刚刚的生成的爬虫。

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。