【python爬虫学习笔记】二、Scrapy框架的基本使用

洛丹伦全境守护者

已于 2022-03-06 18:36:47 修改

阅读量498

点赞数

分类专栏：学习笔记文章标签：爬虫

于 2022-03-06 15:05:06 首次发布

本文链接：https://blog.csdn.net/JeallyBean/article/details/123309783

版权

学习笔记专栏收录该内容

10 篇文章 1 订阅

订阅专栏

Scrapy项目的创建

安装scrapy包
pip install scrapy
在Pycharm中使用命令行创建项目
注意： 这里不要在创建好的python项目中新建，不然会遇到一些莫名其妙的bug
scrapy startproject [项目的名称]
windows 下可以使用tree /F 命令查看目录
在spiders目录下创建一个爬虫
scrapy genspider[你的爬虫文件名] [限定爬虫的范围]

测试运行

	import scrapy
	
	
	class SpidertestSpider(scrapy.Spider):
	    # 爬虫名称
	    name = 'spidertest'
	    allowed_domains = ['quotes.toscrape.com']
	    start_urls = ['http://quotes.toscrape.com/']
	
	    def parse(self, response):
	        print(response.body)
	        # pass

测试检查爬虫，命令行输入：scrapy check spidertest
在这里插入图片描述
运行爬虫：scrapy crawl spidertest

洛丹伦全境守护者

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【python爬虫学习笔记】二、Scrapy框架的基本使用

Scrapy项目的创建安装scrapy包pip install scrapy在Pycharm中使用命令行创建项目scrapy startproject [项目的名称]windows 下可以使用tree /F 命令查看目录在spiders目录下创建一个爬虫scrapy genspider[你的爬虫文件名] [限定爬虫的范围]测试运行 import scrapy class SpidertestSpider(scrapy.Spider): # 爬虫
复制链接

扫一扫